عمان امروز_ بر اساس یک پژوهش تازه از سوی گوگل و معیار ارزیابی FACTS، مشخص شده که حتی پیشرفته‌ترین چت‌بات‌های هوش مصنوعی هم نمی‌توانند همیشه اطلاعات کاملاً درست ارائه دهند. نتایج این بررسی نشان می‌دهد که بالاترین میزان دقت ثبت‌شده حدود 69% است و این یعنی هنوز فاصله قابل‌توجهی با پاسخ‌های صددرصد قابل‌اعتماد وجود دارد.

در این ارزیابی، مدل Gemini 3 Pro با دقت 69% در صدر قرار گرفته و مدل‌های متعلق به OpenAI، Anthropic و xAI عملکرد ضعیف‌تری داشته‌اند. به زبان ساده، تقریباً 1 از هر 3 پاسخی که این سیستم‌ها می‌دهند می‌تواند نادرست باشد؛ حتی زمانی که پاسخ با اطمینان کامل بیان می‌شود.

چنین سطحی از خطا، به‌ویژه در حوزه‌هایی که تصمیم‌های حساس و حیاتی گرفته می‌شود، می‌تواند پیامدهای جدی داشته باشد؛ از جمله در زمینه‌های پزشکی، امور مالی و مسائل حقوقی، جایی که اتکا بی‌چون‌وچرا به خروجی هوش مصنوعی می‌تواند خطرآفرین باشد.