اوپنائی بوٹ ڈاٹ 2 چیمپئنز کو کچلتا ہے، اور اب کوئی اس کے خلاف کھیل سکتا ہے – آرس ٹیکنیکا

اوپنائی بوٹ ڈاٹ 2 چیمپئنز کو کچلتا ہے، اور اب کوئی اس کے خلاف کھیل سکتا ہے – آرس ٹیکنیکا

گلوبل تھرمنولوک جنگ –

بین الاقوامی چیمپئنز ٹیم OG کا اختتام اختتام ہفتہ کے اختتام میں شکست دی گئی تھی.

آگئی ویڈیو گیم راکشس کے اسکرین شاٹ.
بڑھو /

شیڈو فینڈ

گزشتہ کئی سالوں میں، اوپنائی، اس بات کو یقینی بنانے کے مشن کے ساتھ ایک ابتدائی اپ ڈیٹ ہے جس میں “تمام مصنوعی مصنوعی انٹیلی جنس تمام انسانیت کے فوائد” ہیں، جس میں ڈوٹا 2 ، کائنات میں سب سے بڑا کھیل کھیلنے کے لئے مشین سیکھنے والی چلائی ہوئی بوٹ کی ترقی ہوئی ہے . مکمل کھیل کے ایک بہت ہی کم سے نیچے ورژن سے شروع ہونے والے، بوٹ کو لاکھوں میچوں میں لاکھوں میچوں کے ذریعے اپنے آپ کے خلاف تیار کیا گیا ہے، اس کے بارے میں سیکھنے کے لئے کہ کس طرح پانچ سے پانچ ٹیموں کا کھیل نہیں کھیلنا لیکن جیتنے کے لئے کس طرح، مسلسل.

ہم کئی شو میچوں پر بوٹ کی ترقی کو دیکھ سکتے ہیں، ہر ایک کے ساتھ ایک کھیل کے زیادہ مکمل ورژن اور زیادہ ہنر مند انسانی مخالفین کا استعمال کرتے ہوئے. بین الاقوامی. گزشتہ ہفتے کے آخر میں حتمی شو میچ ہونے کی توقع کی گئی ہے، جب اوپنائی پانچ نے او جی کے خلاف سب سے بہترین تین میچوں میں مقابلہ کیا تھا، وہ ٹیم جس نے پچھلے برس تمام آس پاس میں سب سے بڑا مقابلہ جیت لیا.

OpenAI چیزوں کو دلچسپ رکھنے کے نام میں چند ہینڈیکپس کے تابع ہیں. پانچ ایی کھلاڑیوں میں سے ہر ایک بوٹ سافٹ ویئر کا ایک ہی ورژن چل رہا ہے، ان کے درمیان کوئی مواصلات نہیں ہے: وہ پانچ آزاد کھلاڑی ہیں جو بہت ہی سوچتے ہیں لیکن ان کے اعمال کو سنبھالنے کے براہ راست ذریعہ نہیں ہیں. اوپنآئی کے ردعمل کا وقت مصنوعی طور پر سست ہو گیا ہے اس بات کو یقینی بنانے کے لئے کہ کھیل صرف سپرد رگوں کی نمائش نہیں ہے. اور بوٹ اب بھی اس کھیل کا مکمل ورژن استعمال نہیں کر رہا ہے: صرف ہیروز کا ایک محدود انتخاب دستیاب ہے، اور جو چیزیں قابل قدر منین یا بیماری بنتی ہیں وہ پابندی عائد کردی جاتی ہیں کیونکہ یہ محسوس ہوتا ہے کہ بوٹ اس کے معدنیات سے زیادہ مؤثر طریقے سے مائیکروسافٹ کرنے میں کامیاب ہوسکتا ہے. کسی بھی انسان کو.

کھیل دیکھا جا سکتا ہے

یہاں

. پہلا کھیل تقریبا 19 منٹ تک تک پہنچا تھا. انسانوں نے ایک چھوٹا سا سونے کا فائدہ تھا، لیکن بوٹ بہتر علاقائی کنٹرول تھے. ایک ٹیم کی لڑائی میں بٹ آگے آگے آ گئے، تین انسانی کھلاڑیوں کو قتل کرتے ہوئے صرف ایک ہی شخص کو کھو دیا. اس کھیل کو اب بھی یہ دیکھا گیا کہ یہ چاقو کنارے پر تھا، لیکن بوٹ متفق تھے: انہوں نے اعلان کیا کہ جیتنے کا 95 فی صد موقع تھا اور اس اعلامیے پر، ان کی تعداد میں فائدہ اٹھانے کے لئے فوری طور پر انسانی بنیاد پر بھاری نقصانات کا سامنا کرنا پڑا. . اس نے ان کے علاقائی کنٹرول کو مزید بڑھایا اور انہیں بھی ایک اہم سونے کی قیادت دی.

اس نے انسان کو پیچھے پاؤں پر ڈال دیا، اور جب وہ دوسرے 20 منٹ کے لئے کھیل کو نکالنے میں مصروف تھے، تو وہ بولی کی قیادت پر قابو پانے میں ناکام رہے، اوپنائی نے 1-0 سے فائدہ اٹھایا.

دوسرے کھیل میں، چیزوں کو بھی قریب نہیں تھا؛ بوٹ نے ابتدائی لیڈ لیا اور 15 منٹ کے دوران انسانی بیس کو برداشت کیا. انہوں نے پانچ منٹ بعد کامیابی حاصل کی.

مجموعی طور پر، یہ اوپن ایی کی طرف سے ایک اہم کارکردگی تھی: کھیل کی پیشکش کی ہے کہ ایک اعلی سطح پر ایک دوسرے کے ساتھ کھیلنے کے عزم قائم کردہ انسانی ٹیم کے خلاف 2-0 کی جیت. یہ کارکردگی اب برسوں میں اوپنائی کے مضبوط ترین دور سے دور تھا.

بٹس کے نفاذ کی غیر جانبدار ہے: اگرچہ وہ بات چیت نہیں کرسکتے، پانچ کمپیوٹر کنٹرول والے کھلاڑی اسی طرح سوچتے ہیں. اگر کوئی سوچتا ہے کہ یہ ایک انسانی کھلاڑی پر حملہ کرنے کا ایک اچھا موقع ہے، تو ان میں سے چار یہ سوچیں گے اور اس حملے میں شامل ہو جائیں گے. یہ ٹیم کی راتوں میں زبردست تعاون کی ظاہری شکل پیش کرتا ہے- صحت سے متعلق اور سختی کے ساتھ تعاون ہے کہ انسانی ٹیموں سے مقابلہ نہیں ہوسکتا ہے.

ایک چینی چینی کمرہ

لیکن اوپنائی کو قید نظر آتا ہے. اس بات کا یقین ہے کہ اگر حیرت انگیز، کمزوریاں – گزشتہ ہٹوں کو نشانہ بنانے میں بہت اچھا نہیں ہے تو، کمپیوٹر کنٹرول یونٹوں پر قتل عام چلتا ہے جو کھیل میں سونے کے سونے کے لئے استعمال کیا جاتا ہے. یہ انسان کو ایک سونے کا فائدہ حاصل کرنے کا موقع فراہم کرتا ہے. بوٹس انسان کی جانب سے پوشیدہ طور پر پریشان کرنے کے لئے بھی جدوجہد کی گئیں. انھوں نے کچھ ہیروز، خاص طور پر زمین پرستار کے فاسچر سے بعض منتروں کو غریبانہ طور پر اپنانے کے لئے بھی لگ رہا تھا، یہ ایک ایسی شیل ہے جو عارضی طور پر نقشے پر ناقابل اعتماد رکاوٹ پیدا کرتی ہے. انسانوں کو اس کا استعمال کرتے ہوئے بٹ کھلاڑیوں کو ٹراپ کرنے اور ان کی تحریک کو روکنے کے لئے مؤثر تھا، اور یہ اوپنآئ کو الجھن لگ رہا تھا.

اس قسم کے مشین سیکھنے کے نظام اور مکمل عام مصنوعی انٹیلی جنس کے درمیان بڑے فرق میں بٹس کا رویہ بھی ایک سبق سبق ہے. جبکہ اے اے پانچ کھیل جیتنے میں واضح طور پر مؤثر ہے، یہ واضح طور پر نہیں جانتا کہ ڈٹا 2 کیسے کھیلنے کے. کھیل کے انسانی کھلاڑی ان کی طرف کے کمپیوٹر کنٹرول شدہ منینز ( دوٹا 2 میں تخلیق کے طور پر جانا جاتا ہے) کے طور پر جانا جاتا ہے “گولڈ” کہا جاتا ہے کہ ایک ٹیکنالوجی کا استعمال کرتے ہیں دشمن سونے کی ٹیم کو انکار کرنے کا ایک طریقہ کے طور پر. انسانی کھلاڑیوں کو یہ پتہ چلا جاسکتا ہے کہ یہ واقع ہوا ہے کیونکہ جب وہ سمجھے جاتے ہیں تو وہ دکھائے جاتے ہیں. انسانی کھلاڑیوں کو پورے کھیل کا ایک دماغی نمونہ، اس کے قواعد کی تفہیم، اور اس وجہ سے اس بات کو تسلیم کیا جا سکتا ہے کہ کچھ چیز آمیز ہے؛ وہ اس کی وجہ سے کر سکتے ہیں کہ کہاں چلے جائیں اور ھیںچو کے ساتھ مداخلت کریں. اس کے برعکس، کمپیوٹر اس منظر کے ساتھ ہی سامنا کرنا پڑتا ہے.

نہیں ھیںچو

اس کے لاکھوں کھیلوں میں خود کے خلاف کھیلے گئے، اوپنائی نے کبھی کبھی اس کی ٹیکنالوجی کو نکالا نہیں ہوتا، اور اس نے اس کے خلاف کبھی بھی کھیل نہیں سیکھا. لہذا جب انسانی ٹیم کو شروع کرنا شروع ہوتا ہے تو، بوٹ اس صورت حال کو پہچانتا نہیں ہے اور واقعی یہ نہیں جانتا کہ کیا کرنا ہے. اس کی وجہ یہ نہیں ہوسکتی کہ کس طرح کھیل ہونا چاہئے، اور یہ اس بات کا اندازہ نہیں لگا سکتا کہ کھیل غیر متوقع انداز میں کیوں چل رہا ہے. تمام بوٹ کر سکتے ہیں پیٹرن کے لئے نظر آتے ہیں جو اس کو تسلیم کرتے ہیں اور کارروائی کو بہترین نتیجہ حاصل کرنے کے امکانات کو منتخب کرتے ہیں؛ یہ ایک ایسا نمونہ دے دو کہ اسے تسلیم نہیں کیا جاسکتا اور اس کی کارکردگی خراب ہو جاتی ہے.

اب تک، اوپنائی بوٹ محدود ہے. کچھ خاص اور ندیوں کو اس کے خلاف کھیلنے کے لئے رسائی حاصل کی گئی ہے، اور یہ کچھ زندہ واقعات پر بھی کھیلنے کے لئے دستیاب ہے. لیکن چند دنوں کے لئے، یہ تبدیل کر رہا ہے: دوٹا دو کھلاڑی بوٹ کے خلاف کھیلنے کے لئے یہاں سائن اپ کرسکتے ہیں یا اس کے ساتھ – تین دن کی مدت کے لئے. بدقسمتی سے، یہ عوامی دور نہیں لگتا ہے کہ یہ ایک نئے اور بہتر بوٹ کے نتیجے میں جا رہا ہے: سب سے اوپر انسانی ٹیم کو دھکیلنے کا مقصد یہ تھا کہ اوپنائی نے اپنے بوٹ کے لئے مقرر کیا ہے، اور اس کے ساتھ مکمل طور پر تجربہ مکمل ہوجاتا ہے.