في أوائل ديسمبر ، قام باحثون في DeepMind ، شركة الذكاء الاصطناعي التي تملكها الشركة الأم لشركة Google ، Alphabet Inc. ، بتقديم إرسال من ح...
في أوائل ديسمبر ، قام باحثون في DeepMind ، شركة الذكاء الاصطناعي التي تملكها الشركة الأم لشركة Google ، Alphabet Inc. ، بتقديم إرسال من حدود الشطرنج.
وقبل ذلك بعام ، في 5 ديسمبر 2017 ، فاجأ الفريق عالم الشطرنج بإعلانه عن AlphaZero ، وهو خوارزمية تعلم الآلة التي لم تتقن فقط الشطرنج بل لعبة الشطرنج ، أو الشطرنج الياباني ، و Go. بدأت الخوارزمية بدون معرفة بالألعاب خارج قواعدها الأساسية. ثم لعبت ضد نفسها ملايين المرات وتعلمت من أخطائها. في غضون ساعات ، أصبحت الخوارزمية أفضل لاعب ، الإنسان أو الكمبيوتر ، وقد شهد العالم على الإطلاق.
لقد تم الآن استعراض تفاصيل إنجازات AlphaZero وعملها الداخلي بشكل رسمي من قبل النظراء ونشرها في مجلة Science هذا الشهر. تتناول الورقة الجديدة عدة انتقادات خطيرة للمطالبة الأصلية. (من بين أمور أخرى ، كان من الصعب معرفة ما إذا كانت AlphaZero تلعب الخصم الذي اختارته ، وهو وحش حاسوبي اسمه Stockfish ، مع عدالة كاملة). لم تزد قوة AlphaZero في الأشهر الاثني عشر الماضية ، لكن الدليل على تفوقها. إنه يعرض بوضوح سلالة من الفكر لم يراها البشر من قبل ، وأننا سننظر إليها لفترة طويلة قادمة.
لقد حان الشطرنج الكمبيوتر شوطا طويلا على مدى السنوات العشرين الماضية. في عام 1997 ، نجح برنامج الشطرنج "ديب بلو" التابع لشركة آي.بي.ام في التغلّب على بطل العالم البشري غاري كاسباروف في مباراة من ست مباريات. في الماضي ، كان هناك القليل من الغموض في هذا الإنجاز. يمكن لـ Deep Blue تقييم 200 مليون موضع في الثانية. لم يتعب أبداً ، ولم يتخبط أبداً في عملية حسابية ولم ينس أبداً ما كان يفكر به في لحظة سابقة.
للأفضل والأسوأ ، لعبت مثل هذه الآلة ، بوحشية ومادية. يمكن أن يحسب السيد كاسباروف ، لكنه لا يستطيع التفوق عليها . في المباراة الأولى من مباراتهم ، قبل ديب بلو بشراهة تضحية السيد كاسباروف و برميق الأسقف ، لكنه خسر المباراة ال16 بعدها. ولا يزال الجيل الحالي من أقوى برامج الشطرنج في العالم ، مثل ستوكفيش وكومودو ، يلعب هذا الأسلوب اللاإنساني. انهم يحبون التقاط قطع الخصم. يدافعون عنها مثل الحديد. ولكن على الرغم من أنها أقوى بكثير من أي لاعب إنساني ، فإن هذه "المحركات" الشطرنجية ليس لديها فهم حقيقي للعبة. يجب أن يتم تعليمهم في المبادئ الأساسية للشطرنج.
يتم برمجة هذه المبادئ ، التي تم تنقيحها على مدى عقود من الخبرة المهنية الكبرى ، في المحركات كوظائف تقييم معقدة تشير إلى ما يجب البحث عنه في موقع ما وما يجب تجنبه: مدى أهمية سلامة الملك ، نشاط القطعة ، هيكل البيدق ، التحكم المركز ، وأكثر من ذلك ، وكيفية تحقيق التوازن بين المقايضات فيما بينها. ومحركات الشطرنج اليوم ، التي غافلة عن هذه المبادئ ، تعبر عن نفسها على أنها بواعث: سريعة وقوية بشكل هائل ، ولكنها تفتقر إلى البصيرة التامة.
كل ذلك تغير مع ظهور التعلم الآلي. من خلال اللعب ضد نفسها وتحديث شبكتها العصبية أثناء تعلمها من التجربة ، اكتشفت AlphaZero مبادئ الشطرنج من تلقاء نفسها وأصبحت بسرعة أفضل لاعب على الإطلاق. لا يمكن أن تهزم بسهولة فقط جميع أقوى سادة الإنسان - بل إنها لم تهتم بالمحاولة - لقد سحقت ستوكفيش ، بطل العالم في لعبة الشطرنج. في مباراة مائة مباراة ضد محرك هائل حقا ، سجل AlphaZero ثمانية وعشرين فوز و 72 تعادلاً. لم يخسر لعبة واحدة.
كان الأمر الأكثر إثارة للقلق هو أن AlphaZero بدا وكأنه يعبر عن البصيرة. لعبت مثل أي جهاز كمبيوتر من أي وقت مضى ، بشكل حدسي و مبتكر ، مع أسلوب مهاجمة رومانسية. لعبت المغامرة وأخذ المخاطر. في بعض الألعاب كان يشل Stockfish ويلعب معه. أثناء تنفيذ هجومه في اللعبة 10 ، تراجع AlphaZero ملكه إلى ركن اللوحة على جانبه ، بعيدا عن ملك Stockfish ، وليس عادة حيث يجب وضع ملكة مهاجمة.
التعليقات