چیٹ جی پی ٹی آپ کی نوکری چوری کرنے والا ہے – لیکن یہ آپ کو ورڈل میں شکست نہیں دے سکتا
میڈن نے لکھا کہ چونکہ چیٹ جی پی ٹی -4 الفاظ کے ساتھ کام کرتا ہے ، لہذا اعصابی نیٹ ورک کے ساتھ کام کرنے کے لئے ان کا نمبروں میں ‘ترجمہ’ کرنا ضروری ہے۔
پروفیسر کے مطابق انہیں ٹوکنائزر نامی پروگرام میں تبدیل کیا جاتا ہے، جسے چیٹ جی پی ٹی کی پیرنٹ کمپنی اوپن اے آئی “متن میں پائے جانے والے کرداروں کے عام سلسلے” کے طور پر بیان کرتی ہے۔
ماڈل ان ٹوکنز کے درمیان شماریاتی تعلقات کو سمجھتے ہیں ، اور ٹوکن کی ترتیب میں اگلا ٹوکن تیار کرنے میں مہارت رکھتے ہیں۔
لیکن میڈن کو اس نظام میں ایک خامی نظر آئی ہے جو ایک سادہ لفظ گیم جیتنے کے امکانات کو برباد کر دیتی ہے۔

’دوست’ جیسے لفظ کا ٹوکن آئی ڈی 6756 ہوتا ہے، اس لیے ‘دوستی’ جیسے لفظ کو ٹوکن ‘دوست’ اور ‘جہاز’ میں تقسیم کر دیا جاتا ہے۔ ان کو شناخت کنندہ 6756 اور 6729 کے طور پر پیش کیا جاتا ہے۔
جب صارف کسی سوال میں داخل ہوتا ہے تو چیٹ جی پی ٹی -4 درخواست پر کارروائی شروع کرنے سے پہلے الفاظ کو نمبروں میں ترجمہ کیا جاتا ہے۔ گہرے اعصابی نیٹ ورک کو متن کے طور پر الفاظ تک رسائی حاصل نہیں ہے ، لہذا یہ واقعی حروف کے بارے میں دلیل نہیں دے سکتا ہے۔
خلاصہ یہ ہے کہ ، آپ خود ہی آج کے ورڈل کا اندازہ لگانے کی کوشش کر رہے ہیں – ابھی کے لئے۔
میڈن نے لکھا کہ اس پر قابو پانے کے دو طریقے ہیں۔ “سب سے پہلے، چیٹ جی پی ٹی -4 ہر لفظ کے پہلے حرف کو جانتا ہے، لہذا اس کے تربیتی اعداد و شمار کو اس کی ڈکشنری میں ہر لفظ کے اندر ہر حروف کی پوزیشن کی میپنگ شامل کرنے کے لئے بڑھایا جا سکتا ہے.”
یا ، انہوں نے کہا ، چیٹ جی پی ٹی جیسے مستقبل کے بڑے زبان کے ماڈلز کو ورڈل جیسے کھیلوں کے لئے مخصوص کوڈ تیار کرنے کے لئے بھی پروگرام کیا جاسکتا ہے۔
”دوسرا ایک زیادہ دلچسپ اور عام حل ہے.”