«شات جي بي تي» يصدم الأمريكيين.. كلمات عربية داخل المحادثات
تعرّض مستخدمو “شات جي بي تي” في الولايات المتحدة لمواقف غريبة أثارت دهشتهم، حيث فوجئوا بوجود كلمات باللغة العربية بشكل غير مبرر داخل محادثات باللغة الإنجليزية.
وعبر موقع “ريديت” نشر مستخدمون مجموعة من لقطات شاشة لردود يبدو أنها تضمنت نصوصًا عربية عشوائية أو أجزاء من وصفات ومعلومات. وكتب أحدهم: “لقد فعل ذلك مرتين على هاتفي... وأنا لست في بلد يتحدث العربية”.
وبحسب صحيفة ديلي ميل البريطانية، فإن المشكلة لم تقتصر على العربية، إذ ظهرت أيضًا لغات مثل الأرمنية والإسبانية والصينية والروسية، مع تغيّر بعض الأرقام إلى رموز عربية.
ويرجح مختصون أن السبب يعود إلى طريقة تدريب نموذج اللغة الكبير في “تشات جي بي تي”، الذي يقسم النص إلى “رموز” صغيرة قد تشمل أجزاء كلمات أو كلمات بلغات مختلفة، ويختار النموذج أكثر الرموز احتمالًا لإكمال الجملة، ما يؤدي أحيانًا إلى إدخال كلمات غير متوقعة.
وأوضحوا: “نظرًا لأن بعض الكلمات الأجنبية أقصر وأسهل للنظام على معالجتها، فقد يختارها النموذج أحيانًا إذا كانت تتناسب مع السياق وتتطلب عددًا أقل من الرموز. وهذا لا يعني أن الذكاء الاصطناعي يقوم بتبديل اللغات عن قصد، بل يعني ببساطة اختيار الجزء التالي من النص الأكثر احتمالًا بناء على الاحتمالية”.