عمان امروز_ بر اساس یک پژوهش تازه از سوی گوگل و معیار ارزیابی FACTS، مشخص شده که حتی پیشرفتهترین چتباتهای هوش مصنوعی هم نمیتوانند همیشه اطلاعات کاملاً درست ارائه دهند. نتایج این بررسی نشان میدهد که بالاترین میزان دقت ثبتشده حدود 69% است و این یعنی هنوز فاصله قابلتوجهی با پاسخهای صددرصد قابلاعتماد وجود دارد.
در این ارزیابی، مدل Gemini 3 Pro با دقت 69% در صدر قرار گرفته و مدلهای متعلق به OpenAI، Anthropic و xAI عملکرد ضعیفتری داشتهاند. به زبان ساده، تقریباً 1 از هر 3 پاسخی که این سیستمها میدهند میتواند نادرست باشد؛ حتی زمانی که پاسخ با اطمینان کامل بیان میشود.
چنین سطحی از خطا، بهویژه در حوزههایی که تصمیمهای حساس و حیاتی گرفته میشود، میتواند پیامدهای جدی داشته باشد؛ از جمله در زمینههای پزشکی، امور مالی و مسائل حقوقی، جایی که اتکا بیچونوچرا به خروجی هوش مصنوعی میتواند خطرآفرین باشد.