با توجه به اطلاعات جدید منتشر شده در رویداد Google I/O 2025، پروژه جارویس (Project Jarvis) گوگل با استفاده از مدل هوش مصنوعی Gemini 2.0، تحولی در تعامل کاربران با مرورگر وب ایجاد می‌کند. این پروژه به‌عنوان یک دستیار هوشمند وب‌محور، قادر است وظایف مختلف آنلاین را به‌صورت خودکار انجام دهد و تجربه‌ای مشابه به دستیارهای صوتی مانند ChatGPT یا Copilot را ارائه دهد، اما با قابلیت‌های عملیاتی و بصری بیشتر.

JARVIS

معرفی پروژه جارویس

پروژه جارویس، یک سیستم هوش مصنوعی است که برای انجام وظایف مختلف آنلاین طراحی شده است. این سیستم قادر است با استفاده از مرورگر وب، اقداماتی مانند جستجوی اطلاعات، خرید آنلاین، رزرو بلیط و پر کردن فرم‌ها را به‌صورت خودکار انجام دهد. جارویس با استفاده از نسخه جدید مدل زبان بزرگ گوگل به نام جمینی ۲.۰ (Gemini 2.0) توسعه می‌یابد و قرار است در دسامبر ۲۰۲۴ معرفی شود .

جارویس

شما همچنین می توانید برای آشنایی با Meta AI مقاله”Meta AI چیست؟ بررسی جامع هوش مصنوعی متا و نقش آن در آینده فناوری “مطالعه نمایید.

ویژگی‌های کلیدی جارویس

تعامل مستقیم با مرورگر وب

جارویس به‌طور مستقیم با مرورگر وب تعامل دارد و قادر است با استفاده از بینایی مصنوعی (AI Vision)، عناصر موجود در صفحه وب را شناسایی کرده و اقدامات لازم را انجام دهد. برای مثال، می‌تواند دکمه‌ها را شناسایی کرده، فرم‌ها را پر کند و لینک‌ها را دنبال کند .

درک دستورات طبیعی

جارویس قادر است دستورات طبیعی کاربران را درک کرده و بر اساس آن‌ها اقدام کند. برای مثال، کاربر می‌تواند بگوید: “با ۵۰۰ دلار، برای این تاریخ‌ها تعطیلاتی پیدا کن، رزرو کن و جزئیات را به من بده”، و جارویس تمام این مراحل را به‌صورت خودکار انجام خواهد داد .

ادغام با مدل Gemini 2.0

پروژه جارویس بر پایه مدل زبان بزرگ Gemini 2.0 گوگل توسعه می‌یابد. این مدل با استفاده از یادگیری عمیق و پردازش زبان طبیعی، توانایی درک و تولید زبان انسانی را دارد و به جارویس این امکان را می‌دهد که وظایف پیچیده را به‌صورت مؤثر انجام دهد .

JARVIS

شما همچنین می توانید برای آشنایی با انقلاب جدید گوگل مقاله”انقلاب جدید گوگل: ادغام Gemini با مرورگر کروم از فردا آغاز می‌شود! “مطالعه نمایید.

فناوری‌های به‌کاررفته در جارویس

بینایی مصنوعی (AI Vision)

برای تعامل با عناصر مختلف در صفحات وب، جارویس از فناوری بینایی مصنوعی استفاده می‌کند. این فناوری به جارویس این امکان را می‌دهد که تصاویر صفحه را تجزیه و تحلیل کرده و بر اساس آن‌ها اقدامات لازم را انجام دهد .

بینایی مصنوعی

مدل زبان بزرگ Gemini 2.0

مدل Gemini 2.0، هسته اصلی پردازش زبان طبیعی در جارویس است. این مدل با استفاده از یادگیری عمیق، توانایی درک و تولید زبان انسانی را دارد و به جارویس این امکان را می‌دهد که دستورات پیچیده را درک کرده و به‌صورت مؤثر اجرا کند .

تعامل با APIها

جارویس قادر است با استفاده از APIهای مختلف، وظایف مختلف را انجام دهد. برای مثال، می‌تواند از APIهای وب‌سایت‌های مختلف برای جستجو، خرید و رزرو استفاده کند و این اقدامات را به‌صورت خودکار انجام دهد .

چالش‌ها و نگرانی‌ها

حریم خصوصی و امنیت

یکی از نگرانی‌های اصلی در مورد پروژه جارویس، مسائل مربوط به حریم خصوصی و امنیت است. از آنجا که جارویس قادر است به‌صورت خودکار با مرورگر وب تعامل کند و اطلاعات مختلفی را جمع‌آوری کند، احتمال سوءاستفاده از این اطلاعات وجود دارد. گوگل باید تدابیر امنیتی مناسبی را برای حفاظت از داده‌های کاربران اتخاذ کند .

وابستگی به اینترنت

عملکرد جارویس به اتصال مداوم به اینترنت وابسته است. در صورت قطع اتصال اینترنت، عملکرد جارویس مختل خواهد شد و کاربران قادر به استفاده از آن نخواهند بود.

پذیرش کاربران

برخی از کاربران ممکن است نسبت به استفاده از دستیارهای هوشمند مبتنی بر وب تردید داشته باشند. گوگل باید اطمینان حاصل کند که جارویس به‌صورت کاربرپسند طراحی شده است و کاربران به‌راحتی می‌توانند از آن استفاده کنند.

چشم‌انداز آینده

پروژه جارویس می‌تواند نقطه عطفی در توسعه دستیارهای هوشمند باشد. با توجه به توانایی‌های بالای این سیستم در انجام وظایف مختلف آنلاین، می‌توان انتظار داشت که در آینده، دستیارهای هوشمند بیشتری با قابلیت‌های مشابه توسعه یابند. همچنین، با پیشرفت‌های بیشتر در حوزه هوش مصنوعی و یادگیری ماشین، هر روز بیش از پیش وارد زندگی روزمره ما می‌شوند و پروژه جارویس می‌تواند یکی از گام‌های مهم در این تحول باشد. با قابلیت‌های بالا در تحلیل زبان طبیعی، بینایی کامپیوتری و ادغام با سیستم‌های مختلف، جارویس می‌تواند:

جایگزین رابط‌های سنتی وب شود؛ یعنی به‌جای اینکه کاربران صفحات را به‌صورت دستی مرور کنند، هوش مصنوعی این وظایف را انجام دهد.
به‌عنوان دستیار شخصی مجازی برای میلیون‌ها کاربر عمل کند.
در حوزه کسب‌وکار، بسیاری از وظایف تکراری مانند پر کردن فرم‌ها، پیگیری ایمیل‌ها یا استخراج داده از وب را خودکار کند.
در سیستم‌های آموزشی و تحقیقاتی، نقش یک “دستیار تحقیق هوشمند” را ایفا نماید.

برخی تحلیل‌گران معتقدند که جارویس، پیش‌درآمدی بر هوش‌های مصنوعی عمومی (AGI) است، چرا که ترکیب چندین توانایی شناختی در یک سیستم متمرکز، یکی از اهداف اصلی توسعه AGI است.

چشم‌انداز آینده

شما همچنین می توانید برای آشنایی با معرفی مدل جدید هوش مصنوعی Grok 3 از xAI مقاله”معرفی مدل جدید هوش مصنوعی Grok 3 از xAI: انقلابی در توانمندی‌ها و قابلیت‌ها “مطالعه نمایید.

مقایسه با دیگر پروژه‌های مشابه

مقایسه با ChatGPT و Copilot

در حالی که دستیارهایی مانند ChatGPT و GitHub Copilot نیز قابلیت انجام برخی از وظایف را دارند، تفاوت اصلی جارویس در توانایی کنترل کامل مرورگر و تعامل با رابط‌های گرافیکی وب است. ChatGPT نمی‌تواند مستقیماً وب‌سایت‌ها را باز کند یا روی آن‌ها کلیک کند، مگر در محیط‌های خاص و تحت کنترل، اما جارویس به‌صورت واقعی وارد صفحه وب شده و آن را “می‌بیند” و با آن تعامل می‌کند.

مقایسه با Auto-GPT و AgentGPT

پروژه‌هایی مانند Auto-GPT و AgentGPT سعی کرده‌اند وظایف چندمرحله‌ای را به‌صورت خودکار انجام دهند. با این حال، محدودیت‌هایی در تعامل مستقیم با صفحات واقعی وب دارند. جارویس با قابلیت دیدن بصری و درک عناصر صفحه، این محدودیت را پشت سر گذاشته است.

کاربردهای عملی جارویس

در زندگی روزمره

پیدا کردن بلیط‌های پرواز ارزان و رزرو خودکار آن‌ها.
برنامه‌ریزی سفر، شامل رزرو هتل و اجاره خودرو.
پر کردن فرم‌های دولتی یا اداری.
خرید آنلاین کالاها با فیلترهای دلخواه کاربر.

در کسب‌وکارها

پیگیری سفارشات مشتریان.
پر کردن فرم‌های CRM و ورود اطلاعات.
خودکارسازی خدمات پشتیبانی آنلاین.
انجام تحلیل رقابتی با بررسی خودکار وب‌سایت‌های رقیب.

در آموزش

گردآوری منابع تحقیقاتی از وب.
خواندن و خلاصه‌سازی مقالات علمی.
انجام ثبت‌نام‌های دانشگاهی یا کلاس‌های آنلاین.
ایجاد مرورهای هفتگی از فعالیت‌های یادگیری.

نگرانی‌های اخلاقی

با قدرت گرفتن چنین سیستم‌هایی، نگرانی‌های اخلاقی متعددی نیز مطرح می‌شود:

سوءاستفاده از اطلاعات شخصی: اگر جارویس به صفحات حساس دسترسی پیدا کند (مانند بانک یا ایمیل)، ممکن است مورد سوءاستفاده قرار گیرد.
از بین رفتن برخی مشاغل: اتوماسیون وظایف انسانی می‌تواند موجب بیکاری در برخی حوزه‌ها شود، به‌ویژه کارهای تکراری یا خدماتی.
تصمیم‌گیری‌های خودکار: اگر جارویس تصمیماتی بگیرد که بدون تایید انسان انجام شوند (مثلاً خرید یک بلیط گران یا ثبت‌نام در اشتباه)، چه کسی مسئول است؟

این مسائل نیازمند قوانین جدید و بازنگری در چارچوب‌های حقوقی استفاده از هوش مصنوعی هستند.

کلام آخر

پروژه جارویس گوگل یکی از پیشرفته‌ترین تلاش‌ها در زمینه توسعه یک دستیار هوشمند مبتنی بر وب است که ترکیبی از چندین فناوری مدرن را در یک پلتفرم منسجم گرد هم آورده است. با استفاده از مدل قدرتمند زبان بزرگ Gemini 2.0، قابلیت بینایی مصنوعی، و توانایی تعامل مستقیم با صفحات وب، این سیستم پتانسیل آن را دارد که نحوه تعامل ما با اینترنت را به‌طور کامل متحول کند.

با وجود چالش‌های فنی، امنیتی و اخلاقی، آینده‌ای را تصور می‌کنیم که در آن کارهای روزمره آنلاین، به کمک یک دستیار مجازی باهوش و قابل‌اعتماد انجام می‌شوند. پروژه جارویس گامی مهم به سوی این آینده است.