آیا گوگل خواب گوسفند برقی میبیند؟
گوگل به جایی رسیده که یادگرفته مثل شما رویاپردازی کند!
این روزها هشتگ #deepdream خیلی داغ شده و بسیاری از کاربران شبکههای اجتماعی به انضمام چنین هشتگی تصاویری دهشتناک و کابوسوار ضمیمه میکنند.
اگر نمیدانید قضیه از چه قرار است با ما همراه باشید چون نیت کردهایم که مختصر و مفید کل ماجرا را از اول تا آخر برایتان توضیح بدهیم.
فقط علیالحساب بدانید که گوگل یک هنرمند سوررئالیست نشده و قرار هم نیست که کسی بر کل کرهی زمین اسید بپاشد (این را حقیقتاً خیلی هم مطمئن نیستم) و این تصاویری که دست به دست میشوند محصول دستکاری ژنتیکی یا آلودگی هوا هم نیستند (حالا که نگاه میکنم همین را هم نمیتوانم خیلی تضمین کنم).
قضیه از چیزی که شما فکر میکنید بسیار ساده تر است:
گوگل به جایی رسیده که یادگرفته مثل شما رویاپردازی کند!
«الویایکس-1» آهسته گفت:
– من دیشب خواب دیدم.
«سوزان کالوین» چیزی نگفت، ولی خطوط چهرهی این دانشمند سالخورده لحظهای دگرگون گشت.
«لیندا راش»، جوان ریزنقشِ سیهمو، در حالی که دست راستش را پی در پی باز و بسته میکرد، با عصبانیت گفت:
– شنیدی؟ این همانیاست که دربارهاش میگفتم.
..
– از کجا فهمیدی که خواب دیدهای؟
– دکتر «کالوین»، به هنگام شب که همه جا تاریک میشود، ناگهان روشناییای به چشمم میخورد. روشناییای که هیچ علتی برای پدیدآمدنش وجود ندارد. چیزهایی میبینم که به واقعیت ربطی ندارند. چیزهایی میشنوم و واکنشهای عجیبی انجام میدهم. برای درکشان به «دائرهالمعارف» مراجعه کردم و به مدخل «خواب و رویا» رسیدم. وقتی که لغت به لغتش را بررسی میکنم بیشتر مطمئن میشوم که آنچه دیدهام «خواب» نام دارد.
خب حالا که با بخشی از داستان «ربات خواب میبیند» عالیجناب «آسیموف» غافلگیرتان کردم به نظرم وقتش شده که قصهی هوش مصنوعی را با هم مرور کنیم (البته میتوانید بقیهی داستان را با ترجمهی محمد حاج زمان در شگفتزار بخوانید):
قصهی هوش مصنوعی
همهچیز از یک ماشین محاسباتی عظیم شروع شد که «الن تورینگ» برای مبارزه با «ماشین انیگما» اختراعش کرد (بیخیال! یعنی میخواهید بگویید که بازی تقلید را ندیدهاید The Imitation Game؟).
انیگما یک ماشین مکانیکی پیچیده بود که برای تبدیل کردن یک پیام به «رمز» و دوباره بازگشایی کردن همان رمز به کار میرفت. در زمان جنگ جهانی دوم نازیها یک نوع از همین انیگماها را برای خودشان توسعه دادند که «انیگمای ورماخت» نام داشت و تصورش را نمیتوانید بکنید که ناتوانی متفقین دربرابر همین اسلحهی ساده نزدیک بود که به قیمت از دست دادن کل اروپا تمام شود. اینجا بودکه آلن تورینگ وارد شد، همانی که زودتر از بقیهی دانشمندان پرسید:
آیا روزی به جایی خواهیم رسید که از خود بپرسیم: «آیا ماشین هوشیار است و میتواند فکر کند؟»
آلن تورینگ در بلچلی پارک (مرکز کدشکنی انگلستان) مشغول پیداکردن راهکارهایی برای شکستن کدهای آلمانیها بود که در نهایت یک ماشین الکترومکانیکی (Bombe) ساخت که میتوانست بسیار زودتر از هر آدمی روش رمزنگاری انیگما را پیدا کند. اما خدمات او به همین محدود نشد و در سال 1936 هم ماشینی فرضی معرفی کرد که بعدها ماشین تورینگ نام گرفت و مسیر پیدایش ماشینهای محاسباتی را هموار کرد.
ماشین تورینگ علامتهای بر روی یک قطعه نوار بلند را بر اساس جدول قوانین میخواند و دستکاری میکند، یعنی ماشین سه بخش دارد که شامل نوارخروجی، نوار ورودی و پردازندهی مرکزی میشود.
به نظرتان خیلی ساده میآید؟ خب حقیقت این است که غالب کامپیوترهای پیشرفتهی امروزی هم همچنان با مکانیزم ماشین تورینگ قابل توضیحند. در واقع اکثر الگوریتمهای کامیپوتری دقیقاً تابع فرمولی هستند که تورینگ برای ایجاد هوشمصنوعی و انجام دستورات دقیق ابداع کرد.
تورینگ مقالهی معروفش در سال ۱۹۵۰ را با این پرسش شروع کرد که: «آیا ماشینها میتوانند فکر کنند؟» ولی سوالش را بلافاصله با سوال دقیق تری جایگزین کرد که:
«آیا ماشینها میتوانند از بازی تقلید سربلند بیرون آیند؟»
البته بعد از جنگ کسی تورینگ را تحویل نگرفت و به بهانهی طبقهبندی بودن اطلاعات، اختراعش مهر و موم شده ماند و هیچکس متوجه نشد که این وسیلهی ظاهراً ساده تا چه اندازه مسیر جنگ را دگرگون کرده. نه تنها از او به عنوان قهرمان جنگی تقدیر نشد که در دادگاهی به بهانهی شائبهی همجنسبازیاش به تزریق هورمون محکومش کردند تا کار به جایی برسد که پدر علم محاسبهی نوین و مبدع اصلی هوش مصنوعی، برای خلاصی از عوارض روحی و جسمی هورمونها با خوردن سیبی آغشته به سیانور خودکشی کند. شاید همان سیب گاززدهای که امروز لوگوی شرکت «اپل» شده.
آیا ماشین تورینگ همان چیزی بود که آسیموف هشدارش را میداد؟
کامپیوترها خیلی زود در محاسبات ریاضی از ما جلو زدند و از خیلی وقت پیش مطمئن شدهایم که در حل معادلات دیفرانسل مرتبه بالا به گردشان هم نمیرسیم. اما درست وقتی که همهی دانشمندان از روند پرشتاب رشد هوش مصنوعی شگفتزده شده بودند، با حقایق ناامیدکنندهای هم روبرو شدند.
وقتی نسلهای ابتدایی روباتها را در یک اتاق آزمایشی مورد آزمون قرار میدادند، ساعتها طول میکشید تا راه خروج را تشخیص بدهند. تازه آن هم اتاقی که فقط شامل بر اشکالی همچون مربع و مثلث میشد و مسیر خروج تابعی از خطوط مستقیم تعریف شده بود. اگر هم که کسی یک دست مبل منحنی با اشکال غیرهندسی کنار ربات میگذاشت نتیجه از قبل هم ناامیدکنندهتر میشد. بعد در همان حال که روبات دیگر داشت کلافه میشد، پشهای که مغز کوچکش فقط ۲۵۰.۰۰۰ نورون دارد از روی شانههای روبات پرواز میکرد و در مسیری آرام و مطمئن بیرون میرفت. آن زمان دیگر عدهای مطمئن شده بودند که تقدیر این است که روباتها همیشه اینقدر احمق بمانند.
ریشهی این مشکل به شیوهی مرسوم آموزش هوش مصنوعی آن موقع یعنی «روش کل به جزء» بر میگشت. یعنی در واقع میتوان گفت که روباتهایی که به شیوهی تورینگ آموزش میدیدند عملکردهای جدید را یاد میگرفتند ولی نمیفهمیدند.
شاید بهتر باشد که این وضعیت را این گونه توضیح بدهیم که یک هوش مصنوعی آموزشدیده از طریق کل به جزء، مثل یک توریست خارجی میماند که به چین سفر کرده، بیآنکه یک کلمه چینی بداند. اساتید هوش مصنوعی هم برای این که توریست بیچاره گم نشود، کتابی دستش دادهاند که «چینی در سفر» نام دارد. توریست ما (همان هوش مصنوعی مورد نظر) هر جا که گیر میافتد به مدخلهای کتابی که به او دادهایم رجوع میکند: چگونه احوالپرسی کنیم؟ چگونه ساعت را بپرسیم؟ چگونه ادرس را بپرسیم؟ محاوره در رستوران. محاوره با یک پلیس و…
پس توریست ما وقتی که غذا میخواهد میگوید: Wǒ xūyào shíwù ولی هیچ ایدهای ندارد که تک تک این کلمات چه هستند و به چه کاری میآیند. یک مشکل دیگر این است که تمام چیزهایی که در کتاب راهنما آمدهاند برای یک شرایط فرضی خاصاند و ممکن است توریست ما وقتی که با یک چینیای که لهجهی دهاتی دارد روبهرو شود از نا بیفتد ولی یک کلمه از حرفهای او را متوجه نشود. باز بسیاری شرایط دیگر امکان دارند که شاید اصلا در کتاب نباشند و یا که باشند ولی جستو جویشان در صفحات کتاب وقت زیادی بگیرد.
شما به واسطهی میلیونها سال تکامل به نقطهای رسیدهاید که در تشخیص الگوها و حتی شناسایی الگوهای ناقص به درجهی استادی رسیدهاید. تصور کنید که وقتی در جنگلی انبوه مشغول پیادهروی هستید و ببری به شما حملهور میشود، تشخیص این که آن اعوجاجِ چشمدارِ بین برگها یک حیوان وحشی خطرناک است برای شما در آنی صورت میپذیرد ولی یک کامپیوتر کلاسیک باید میلیونها خط دستور اجرا میکرد تا تشخیص بدهد که نیاز است که احساس خطر کند یا نه!
شما وقتی که در یک استادیوم شلوغ برای لحظهای دوستتان را گم میکنید بلافاصله از میان نویز سنگین هزاران تماشاگر پر سر و صدای دیگر صدای رفیقتان را تشخیص میدهید و جهت و فاصلهی او را هم فوراً تخمین میزنید. این نوع پردازش همان چیزی است که محققین هوش مصنوعی آرزویش را داشتند. همان چیزی که «پردازش صوت و تصویر و داده» و «کنترل روباتها و سیستمهای قدرت و یا مخابرات» و «هدایت وسایل نقلیهی هوشمند» را ممکن میکرد.
بعد از این احساس نیاز برای چندین دهه ارتش آمریکا میلیونها دلار خرج میکرد تا سرباز مکانیکی و خودروی هوشمند بسازد، ولی نتیجه نگرفت. حتی در اوج خوشبینیها که برنامهی کامپویتری دیپ بلو (Deep Blue) گری کاسپاروف را در بازی شطرنج شکست داد، دانشمندی به نام «دوگاس هوفسواتر» گفت:
خدای من! فکر میکردم بازی شطرنج همیشه نیازمند فکر کردن باشد و حالا فهمیدم که نه. در واقع میتوان پرواز کرد بیآنکه پر زد.
هوفسواتر و باقی محققین علوم کامپیوتری عقب ماندگی شدید هوشهای مصنوعی را در برابر هوش طبیعی درک میکردند چون میدانستند هنوز چه راه طولانیای مانده تا بشود گفت یک ماشین باشعور ساختهایم. تصور کنید در همان کتاب راهنمای آقای توریستمان تکتک دانستههای لازم برای باشعوربودن (common sense) را هم بنویسیم، که مثلاً:
آب تر است / حیوان از درد خوشش نمیآید / کسی که بمیرد دیگر برنمیگردد / نخ فقط کش میآید / زمان فقط به جلو میرود و دهها میلیون کد دیگر.
اما اگر بر فرض بعد از دهها سال تمام محتویات شعور را در دائرهالمعارفمان گرد کردیم و باز بر فرض محال توانستیم که بهروز هم نگهش داریم، آیا باز با کوچکترین تغییر (نویز) روند آموزشمان به هم نمیخورد؟ که کامپیوتر بپرسد:
به چه مایعی آب گفته میشود؟ چند درصد باید H2O در آن موجود باشد؟ آیا مایع قهوهای روان در جوی هم آب است؟ پس چرا یخ که از H2O است به اندازهی آب تر نیست؟
پیشبینی آب و هوا با تحلیل حجم عظیمی از دادههای ماهوارهای برای هوشهای مصنوعی امروزی مثل آب خوردن است ولی آیا واقعاً میتوان بهشان حالی کرد که هرزهنگاری چه تفاوتی با نقاشیهای برهنهی دورهی رنسانس دارد؟
مگر درون مغز ما چه خبر است که روباتها از تقلیدش عاجزند؟
از آن دوران که مصریان موقع مومیایی کردن محتویات درون جمجمه که بیارزش میپنداشتند را بیرون میریختند زمان بسیاری گذشته؛ از دوران جالینوس هم که سه حفره در جمجمه یافته بود و ایشان را مسئول تصور و عقل و حافظه میدانست؛ از دوران دکارت هم که مغز را یک ماشین هیدرولیکی توصیف میکردند. که حالا میدانیم مغز تودهایست به حجم 300cm^3 و وزن 1/5KG و تنها یکی از اجزای سیستمی پیچیده شناخته میشود و حتی به شکل نخاع در امتداد ستون فقرات ادامه مییابد و عصبهایی منتشر میکند که از همه جای بدن میآیند و به همه جای بدن هم میروند. در واقع مغز خیلی فراتر از یک CPU ساده است که ماشینیست ساخته شده از مولکولهای آلی، پروتئینها، لیپیدها، کربوهیدراتها، عناصر نشانه و مقدار زیادی آب نمک که با رشتهای از فرآیندهای الکتریکی و شیمیایی زنجیرهای عمل مینماید.
یعنی برخلاف کامپیوتر شما که هیچ اهمیتی ندارد که قطعاتش فلزی، پلاستیکی و یا سیلیکونی باشند، مغز شما دقیقاً همان چیزهایی است که ساختمانش را تشکیل میدهند.
کوچکترین واحد عملیاتی مغز نورونها هستند که وظیفهی تحلیل سیگنالهای الکتریکی درون مغز به عهدهی آنهاست. برای این که تفاوت عملکرد مغز را با یک رایانهی معمولی متوجه بشویم ناگزیریم یک مثال دیگر را به ذهن بیاوریم. تصور کنید که مغز کشوری گسترده باشد که همیشه مورد تهدید حملهی وحشیهاست. در یک کشور عادی (مثل کامپیوتر) اطلاعات جمع میشوند و فرماندهی کل قوا تشخیص میدهد که بر اساس شرایط حال حاضر و قواعد جنگی چه فرمانی داده شود (مثلاً کتاب «هنر جنگ» که حاوی مجموعهای از برنامهها و استراتژیهای از پیشتعیینشده است). اما در کشور مغز برخلاف آن کشور عادی هیچ فرماندهی متمرکزی وجود ندارد!
در کشور مغز اولین نورونی که احساس خطر کرد مثل سرخپوستها اتشی بزرگ بر فراز تپهای روشن میکند تا نورونهای آن حوالی را با خبر کند. یعنی مغزیها یا به حساب نورونها با ابتداییترین وسیلهی ممکن یکهو تصمیم میگیرند که کشورشان مورد هجوم وحشیها قرار گرفته و یا نه و باز در آن واحد بیآنکه لازم باشد اطلاعات را به فرماندهی کل قوایی ارائه بدهند واکنش هم نشان میدهند. شاید راز این معما در رفتارهای گوناگون مغزیها باشد چون که ما حالا میدانیم همهی نورونها خلق و خویی یکسان ندارند. بعضی زودباورند و بعضی هم بسیار دیر چیزی را میپذیرند. مثلاً نورونی به اسم «آقای یک» ممکن است تا هشداری از سمت «آقای دو» ببیند آتشش به راه شود ولی بر اساس تجربیات گذشته هیچ اهمیتی به آتشهایی که «آقای سه» روشن میکند ندهد. بعضی نورونها هم هستند که تا دهها آتش روشن نبینند پیام خطر را مخابره نمیکنند ولی در عوض آتشی که روشن میکنند ممکن است دود بسیار بیشتری داشته باشد و نورونهای بیشتری را در آن حوالی به هول و ولا بیندازد.
پس مغز کشوریست که به جای داشتن یک فرمانده مقتدر ترجیح داده که مسائل دشوار را بین سربازهایی بسیار عادی پخش کند. ماشینی که دشوارترین مسألهها را به سادهترین اجزا واگذار میکند. عناصر عملیاتیای که همگی موازی هم کار میکنند و شبکه همیشه و در همه حال بر مبنای تطابق و همسنجی بین ورودی و هدف سازگار میشود. وقتی یک نورونی بالاتر از یک مقدار معینی تحریک شود برانگیخته میشود به طرزی که یک ولتاژ عملکرد را در طول مسیر بازوهایش آزاد میکند (Action Potential یا به حساب همان آتش سرخپوستی). آتش که به انتهای بازو رسید تبدیل به دود میشود یعنی در واقع ولتاژ عملکرد سبب ترشح پیامرسانهای عصبی یا نروترنسمیترها (Neurotransmitters) خواهد شد که نروتسمیترها همان زبان مشترک و قابل تفسیر بین نورونهایند. گفتنی است یکجای مثال ما میلنگد چون برخلاف دود آتش سرخپوستی، نروترنسمیترها دو نوع دود دارند: سیگنال تحریک کننده و سیگنال مهار کننده.
هر نورونی اطلاعاتی که به زبان نروترنسمیتری هستند را از همه طرف خودش جمع میکنند و اگر قانع شد خودش هم آتش دیگری روشن میکند تا مسیر ادامه یابد. نتیجه این که فرآیند آموزش چیزی نیست جز تجربیات نورونها در شناختن نورونهای همسایه. پس چیزی که ما به آن یادگیری میگوییم فرآیندی بسیار ساده است که با تشکیل الگوهایی از اتصالات بین نورونها شکل میگیرد، یعنی گاهی با ایجاد اتصالات جدید بین بعضی از نورونها میسر میشود و گاهی با قطع شدن همزمان اتصالات قدیمی دیگری یا که شدید و یا ضعیف شدن شدت اعتماد نورونی به نورون دیگر.
حالا در نظر بگیرید که 1011 تعداد نورون در مغز شماست که هر نورون ۱۰۰۰ بازوی ورودی (دندریت) دارد پس در نتیجه ما «۱۰۰۰ ضربدر 1011» اتصال (سیناپس Synapse یا همان نقاط همسایگی) در مغزمان داریم. باز در نظر بیاورید که نورونهای ما در هر ثانیه میتوانند صدبار آتش کنند که حالا قابل توجیه است که چرا عضوی که فقط 2 درصد از بدن را تشکیل میدهد ۲۰ درصد از انرژیاش را مصرف میکند. زیرا که بیشتر این انرژی صرف تقویت پیامهای الکتریکی (یا در مثال برپا کردن آتش سرخپوستی) در طول رشتههای پیچیدهای از بازوها میشود که چنان شبکهی عظیمیاند که اگر قرار باشد تمام این بازوهایی موجود در مغز یک انسان را از هم باز کنیم و به هم گره بزنیم، روبانی بلند درست خواهد شد که میتوانیم با آن دوبار محیط کرهی زمین را دور بزنیم.
حالا برگردیم و یکبار دیگر مرور کنیم که در بالاخانهی یک موجود بیولوژیک چه خبر است:
۱- تعداد بسیار زیادی ارتباط موازی بین نورونها وجود دارد
۲- خروجی لزوماً بله یا خیر نیست و ماهیت باینری ندارد (درواقع میتوان گفت رابطهی بین نورونها وزندار است).
۳- برخی از نورونها میتوانند نورونی را تحریک کنند ولی همزمان عملکرد نورون دیگری را مهار کنند.
۴- تحلیل مرکزی وجود ندارد و مغز با از دست دادن تعدادی نورون عملکرد خودش را هرگز از دست نخواهد داد.
۵- عملکردها همزمان نیستند.
۶- برنامهای را اجرا میکنند که به طور کامل توزیع شده است و به شکل چندقسمتی اجرا میگردد.
بله دقیقاً همین جاست که شما تصویر صورت دوستتان را تشخیص میدهید، ما بین همین اتصالات است که شوخی جدیدی به ذهنتان میرسد و یا بحث فیلسوفانهای نو نطفه میاندازد و همین خصوصیاتهای ظاهراً ساده بود که از حیطهی نورولوژی و علوم شناختی به مهندسی فراخوان شدند و کمک کردند که ما به جایی برسیم که چیزهایی مثل کورتانای مایکروسافت و یا سرویسهای ترجمهی همزمان جدید اسکایپ و یا نرمافزار تشخیص و بهینهسازی تصاویر گوگل ساخته شوند.
بالاخره شبکههای عصبی مصنوعی
پنجاه سال پیش که ما بالاخره به قدرت مغزهای بیولوژیکی ایمان آوردیم، به نقطهای رسیدیم که جرات کنیم برنامههایی بنویسیم و مداراتی بسازیم که قادر باشند شبکههای عصبی زیستی را همانندسازی کنند. بله! بازی تقلید شروع شده بود.
اولین مدل ریاضی شبکههای عصبی توسط مک کلاچ (عصبشناس) و پیتز(متخصص آمار) در سال ۱۹۴۳ ارائه شد که هیچ کاربردی نداشت و فرآیند یادگیری و سازگاری برایش اصلاً تعریف نشده بود. گام مهم بعدی را روزنبلت در سال ۱۹۵۸ برداشت که نتیجهی شبیهسازی او به عنوان اولین نمونهی موفق شبکههای عصبی مصنوعی معرفی شد. شبکهی عصبی مصنوعی روزنبلت (مشهور به مدل پرسپترون) از پس بسیاری از مسائل طبقهبندی و تخمین برمیآمد. اگر بخواهیم روش کار نمونههای اولیهی شبکهی عصبی مصنوعی (Artificial Neural Networks به اختصار ANN) را تا حدودی درک کنیم، ناگزیریم که به مثال زیر متوسل شویم. البته این مسأله به دلیل وجود نویز و خطای بسیار در واقعیت چندان کاربردی نیست، ولی به خوبی اساس منطق یک شبکهی عصبی مصنوعی را توضیح میدهد:
(اگر حوصله ندارید یا خیلی به موضوع علاقهمند نیستید، میتوانید علامت ضربدر را بزنید و بیخیال خواندن این مثال بشوید)
فرض کنید که قرار است شما قاعدهای را برای تخمین شغل مردم پیدا کنید. روش کار بدین گونه است که چندنفر را جمع می کنید و به میزان علاقه ی ایشان به سریال پیشتازان فضا نمره میدهید (ورودی یک) و توانایی ریاضیشان را هم در آزمونی محک می زنید (ورودی دو) . حال از تک تک ایشان شغل حقیقی شان را می پرسید تا مکان هر کس در نمودار مشخص شود. حالا بعد از چندبار آزمون و خطا سعی می کنید خطوط همرسی بکشید تا افرادی با مشاغل متفاوت به صورتی صحیح دستهبندی شوند. پس حالا با وجود همین خطوط میتوانیم ادعا کنیم که در حالتی ایدهآل اگر هر کس دیگری را هم از خیابان بیاورند و از او دربارهی میزان علاقهاش به پیشتازان فضا و تواناییاش در ریاضی پرس و جو کنند، شما میتوانید بر اساس ورودیها جایش را در نمودار پیدا کنید و شغلش را حدس بزنید بیآنکه هیچ تقلبی در کار باشد (یعنی میتوانیم یادگیریمان را تعمیم بدهیم). اگر هم برفرض شغل غریبهای که شما حدس زدید اشتباه درآمد باید باز برگردیم و اندکی خطوط را جا به جا کنیم تا سرانجام خطوط به جایی برسند که هر داده ی جدیدی را پوشش بدهند تا در نهایت با کمترین خطا از پس وظیفهی خودمان بربیاییم.
بنا به این تئوری اگر ما به اندازهی کافی شبکهمان را آموزش دهیم بالاخره شبکه به جایی خواهید رسید که با تغییر پارامترهای خود (در مثال همان خطوط همرس کشیده شده بر نمودار) بتواند خروجی شبکه را از خروجیهای اشتباه اولیه، به سمت خروجیهای مطلوب همگرا کند. به همین ترتیب زود توانستند به شبکهی روزنبلت آموزش بدهند که چگونه اشکال مربعی را از اشکال غیر مربعی تشخیص بدهد بیآنکه نیاز باشد تمام حالتهای ممکن مربع بودن یا نبودن را برایش تعریف کنند. ولی مشکل از آنجا شروع شد که قرار بود کامپیوتر غیر از اینکه مثلاً تشخیص بدهد شکل مربع است یا نه، همزمان مربعهای قرمز را هم از مربعهای غیر قرمز جدا کند. در واقع اگر بخواهیم به همان مثال قبلیمان برگردیم، حالت پیچیدهتری شبیه شکل زیر وجود دارد که ممکن نیست صرفاً با کشیدن همان یکدست خطوط همرس قبلی، بتوانیم طبقهبندیمان را کامل کنیم (یعنی به خطوط همرس بیشتری نیاز داریم).
همین مشکل علیالظاهر بسیار ساده (مشهور به The XOR saga)، برای چندین دهه پیشرفت هوش مصنوعی را متوقف کرد (گرچه ضعف پردازندههای مورد استفاده در آن دوران هم مزید بر علت بود).
اما برخلاف روند ظاهراً متوقف تحقیقات هوش مصنوعی، زیستشناسان از مطالعه بر روی هوش بیولوژیکی دست نکشیدند و با تحقیق در زمینهی فرآیند بینایی، از رموز اساسی نوروساینس پرده برداشتند. در واقع در همان دهه شصت میلادی دانشمندان فهمیدند که اعصاب بینایی با معماریای بسیار لایهدرلایهتر از آن چه تصور میشد بینایی را امکانپذیر میکنند. یعنی نورونهای شبکیه مسئول تشخیص نقاط تاریک و روشنند ولی نورونهای قشر اصلی بینایی مغز به اشکال و زوایا واکنش نشان میدهند و نورونهای قشر پایینی هم اشیای پیچیدهای مثل چهره و دست و پا و … را میفهمند.
یعنی مغز اطلاعات را به عناصر پایهشان تجزیه میکند تا روابط بین آنها را به طور کامل درک کند تا برای مثال وقتی شما به تصویری خیره میشوید این طور نباشد که مغزتان با اطلاعات انبوهی از نقاط رنگارنگ روبرو شود، بلکه شما خطوط، لکهها، رنگها و روابط بینشان را جداگانه میبینید.
پس در طبقات اولیهی بینایی فقط خصوصیات سادهای همچون موقعیت و لبه و شدت نور واکاوی میشود و فقط در مراحل بعدتر است که مشخصههای پیچیدهتری مثل حرکت و رنگها مورد بررسی قرار می گیرند.
همین دستاورد به روندهای شناختی دیگر مغز مثل فرآیند تشخیص زبان هم تعمیم داده شد تا با توجه به همین دستاوردها مدل سازی شبکه های عصبی مصنوعی به سمت مدلهای با پردازشهای سازمانیافتهی لایهای بروند. مدلهایی که یادگرفته بودند مرحله به مرحله یاد بگیرند و باز مرحله به مرحله برگردند تا خطاهای شبکه را تعدیل کنند.
با در نظر گرفتن این الگوی جدید رفتار نورونها، بازی تقلید به مرحلهی خطرناکتری رسید. نرمافزارها یاد گرفتند که مثلاً برای شناسایی تصویر، در لایهی اول فقط روشنایی پیکسلها را پردازش کنند تا لایهی بعدی هم خطوط و زوایا را تشخیص بدهد و همینطور زنجیروار به شناختی عمیقتر برسند تا اشکال پیچیدهای مثل چشم یا چرخ قابل درک شوند. برای رفع همین نیاز است که گوگل اعلام کرده در نرم افزارتصاویر گوگل (Google Photos) سی لایه شبکهی عصبی به کار بسته.
گوگل باهوش میشود
حالا دیگر روش کار را یاد گرفته بودیم و کامپیوترهایمان هم اینقدر قدرتمند شده بودند که دیگر مانعی بر سرکار نباشند، پس تنها چیزی که مانده بود مقادیر عظیمی از داده بود تا به خورد هوش مصنوعی نوزادمان بدهیم. راستش این همان بخشی بود که بی کمک من و شما میسر نمیشد. مجموعهی آموزشی هوش مصنوعی معظمی همچون گوگل، چیزی نبودند جز ویدئوهای یوتیوب شما، یا عکسهایی که قبلاً پست کردهاید و کنارش تصویر را هم توضیح دادهاید. هوش مصنوعی تازه متولد شده، ویدئوها را یکی یکی میدید و در لایههای مختلفش پردازش میکرد، سپس چیزهایی را که شنیده بود یا دیده بود را حدس میزد و سرآخر جوابش با جواب یک انسان واقعی مقایسه میشد تا با فهمیدن خطاهایش دنبال اصلاح متغیرهای درون شبکه بیفتد.
شبکههای عصبی مصنوعی خیلی زود یادگرفتند که صبور باشند و به جای حفظ کردن، درک بکنند (یادگیری عمیق Deep Learning) و در صورتی که متوجه اشتباه بودن تشخیص خودشان شدند، یکی یکی لایهها را برگردند و مقادیر را دستکاری کنند تا پاسخ خطایشان دوباره تکرار نشود (یادگیری پسانتشار Back-Propagation). این طور بود که نرمافزار تشخیص گفتار گوگل (مبتنی بر شبکههای عصبی مصنوعی) در سال 2011 با درصد خطایی در حدود 25 درصد به نمایش گذاشته شد (از هر چهار تصویر یکی را اشتباه تشخیص میداد)، ولی همین نرمافزار بعد از سه سال آنقدر پیشرفت کرد که حالا فقط 8 درصد خطا دارد.
البته فقط گوگل از شبکههای عصبی مصنوعی بهره نبرد که فیسبوک هم الگوریتم DeepFace را معرفی کرد که فقط با سه درصد خطا از پس تشخیص چهرهی انسان برمیاید. Wolforam Alpha هم نرمافزاری ساخت که میتواند اشیاء را شناسایی کند و مایکروسافت هم دستیار صوتیاش یعنی کورتانا را به جایی رساند که فرق بین تصویر دو سگ مثلاً از خانوادهی پمبروک ولش کورگی و کاردیگان ولش کورگی را راحت متوجه میشود.
اسکایپ هم با توسل به همین الگوریتمها ترجمهی همزمان را برای مکالماتش راهاندازی کرده، موتور جستوجوی چینی (Baido) در حال هدفمندسازی تبلیغاتش با به کارگیری همین روش است و باز گوگل بات چتی (ChatBot) درست کرده که خیلی بهتر از قبل از پس مکالمههای عادی برمیآید.
البته اگر احیاناً شما آسیموف هستید که این جملات را میخوانید، باید بگویم که جناب آسیموف! هنوز نباید خیلی بترسید چون تا پایان مقصد راه بسیار طولانیای مانده. نشان به آن نشان که نرمافزار Google Photo هنوز در تشخیص یک فرد سیاهپوست از گوریل دچار اختلالاتی هست. حتی نرمافزار تشخیص تصویر فلیکر که به مدد یاهو توسعه یافته، در موردی یک مرد رنگینپوست را شامپانزه تشخیص داد. البته اگر از زاویهی دیگری به مساله نگاه کنیم ممکن است به این فرضیه برسیم که شاید هوشمصنوعیها نژادپرست شدهاند! (گوگل این مشکل را فعلاً با برداشتن تگ گوریل رفع کرده)
پس ماجرای خواب دیدن گوگل چه شد؟
شبکهی عصبی هوش مصنوعی گوگل که حالا با هزاران هزار تصویر مختلف آموزش داده شده، جدیداً خواص عجیبی از خودش نشان داده.
مثلاً محققین گوگل فهمیدهاند که هوش مصنوعیای که ساختهاند نه تنها میتواند الگوهای مختلف را تشخیص بدهد، که میتواند با شنیدن اسم اشیاء مختلف، آنها را مثل تصاویر زیر تصور بکند!
اگر یادتان باشد چند سطر قبل گفتیم که هوش مصنوعی با تقلید از روند زیستی هوش انسان، به سمتی رفته که در لایههای اول خصوصیات سادهای مثل روشنایی، خطوط و زوایا را نشخیص میدهد. حالا فرض کنید که از یکی از همان لایههای اولیه بخواهیم که قضاوت خودشان را دربارهی یک تصویر خاص به ما نشان بدهند:
باز فرض کنید حالا از لایههای بالاتر که برای تشخیص تصاویر پیچیدهتر آموزش دیده شدهاند (فرض کنید لایهای یادگرفته باشد فقط حیوانات را تشخیص بدهد)، طلب کنیم که تصورات خودش از یک عکس دیگر را نشانمان بدهد. این مثل حالتی است که شما برای چندثانیه به یک شیء خاص خیره بمانید و بعد یک دفعه به آسمان نگاه کنید.
شما میتوانید این قضیه را به عنوان بیماری تشخیص الگو به یاد بسپارید (مثل وقتی که به ستارهها خیره میشویم و از چیدمانشان چهرهی یک آدم را شناسایی میکنیم. یا مثل وقتی که در اشکال اتفاقی ابرها یا حتی سطح معوج کرهی ماه تصاویر دوستان و یا الگوهای آشنا را مییابیم. در واقع هم ما و هم گوگل زیادی عادت کردهایم که دنبال الگوهای آشنا باشیم):
اگر عکس بالا را بزرگنمایی کنیم از دیدن توهمات گوگل حیرتزده میشوید:
محققین گوگل باز یک قدم جلوتر رفتند و با ماشینشان یک بازی جدید را تمرین کردند. آنها مثلاً از شبکهای که در تشخیص تاقهای قوسی خبره شده بود خواستند که هر چیزی که از تاق قوسی میداند را تصویر کند (اینها مثل متخصصانی میمانند که هرجا را نگاه کنند تخصص خودشان را میبینند)، که نتیجه چیزی شبیه آثار موریس اشر شد (این هنرمند میتوانست با نقاشیهای خود سازههایی ترسیم نماید که به نظر غیرممکن میرسیدند و به نوعی مفهوم بینهایت را تداعی میکردند. مفهوم دیگری که در نقاشیهای این گرافیست زیاد به چشم میخورد، مفهوم دگردیسی و تبدیل و تناسخ یک موجود به موجودی دیگر در زنجیرهای بیانتهاست):
شما هم میتوانید با رفتن به این آدرس با هوش مصنوعی گوگل ور بروید و برای نمونه یک توهم اسیدی این چنینی از تصویری از سریال بازی تاج و تخت بسازید:
یا حتی مدمکس:جادهی خشم:
امیدوارم که توانسته باشم روند رسیدن به این تکنولوژی را تا حدودی برایتان شفاف کنم. در پایان از شما دعوت میکنم که این ویدئوی ۵ دقیقهای از آنچه در سر گوگل میگذرد را تماشا کنید:
نمیدانم شاید با این اوضاع باید مثل دکارت در فیلم بلید رانر (Blade Runner فیلمی از ریدلی اسکات بر اساس داستان «آیا آدم مصنوعیها خواب گوسفند برقی میبینند؟» نوشتهی فیلیپ ک. دیک) دنبال راهی برای تشخیص آدم مصنوعیهای خلافکاری بیفتیم که به شدت شبیه انسانند. در این حد که شاید خواب گوسفند برقی هم ببینند.
اگر دوست دارید که دربارهی شبکههای عصبی مصنوعی و توسعه روابط ریاضی حاکم بر الگوریتمهای آنها بیشتر بدانید، من کتاب «شبکههای عصبی» نوشتهی دکتر فیل پیکتن را توصیه میکنم که دکترمیرصالحی و دکتر تقیزاده به فارسی ترجمهاش کردند و توسط انتشارات دانشگاه فردوسی به چاپ رسیده.
-
O_o
خیلی جالب بود!!! خیلییییییییییی!
واقعا ممنون. خسته نباشید 🙂-
خواهش میکنم. خوشحالم خوشتون اومده 🙂
-
-
مطلب خیلی خیلی جالبی بود. دستتون درد نکنه
-
خواهش میکنم. خیلی خیلی باعث خرسندیه که شما مقاله رو دوست داشتید.
-
-
زحمت کشیدی برای مطلب، تشکر خیلی خوب بود.
-
خواهش میکنم دوست عزیز. قابلی نداشت. امیدوارم ما رو دنبال کنی همچنان
-
-
دهنش سرویس!
-
😀
-
-
خیلی کامل بود! و البته جذاب!:)
-
خوشحالم که خوشتون اومد و براتون مفید بود
امیدوارم همچنان دنبالمون کنید
-
-
ممنون
-
خواهش میکنم
و ممنونم که ما رو میخونید
-
-
چقددددددددر مطلب جدید و جالبی بود !
واقعاً جزء معدود مطالبی بود که تا آخرش با کنجکاوی و لذت خوندمش
مرسی که به اشتراک گذاشتین این مطلب رو -
مطالب بسیار جالبی نوشته اید. از خواندن این مطلب خیلی لذت بردم. موفق باشید.
-
من اینجور مطالبو واقعا دوست دارم ممنون از بهاشتراک گذاری این ها
-
خیلی مطلب خاصی بود مخاطب رو جذب میکنه مرسی از شما
-
سلام…
خیلی خوبه که اینجور اطلاعات رو توی اینترنت میبینم. این باعث میشه که اطلاعاتت رو ببری بالا.
از طراحی سایت شما خوشم اومده…
امیدوارم اطلاعات این سایت همیشه بروز باشه تا بقیه ازش استفاده کنن… -
هوش مصنوعی به این میگن.
-
واقعا این مطلب صحت داره؟ خیلی جالبه
-
من الــان یه چیزیو نمیفهمم
من و سردرگم کرده و راستشو بخوای تا یه حدی ام دلم خالی شده و
تو استرس دارم این و مینویسم
ببین من اسید برداشتم
خیلی زیاد و از تجربه هایی ام که داشتم راضی بود
ولی یه چیزی که راجب اسید وجود داره اینه که اصلا مهم نیست طیف فکریت چجوری باشه
دیدن یا همون بصر این شکلیه
دقیقا همین شکلی که این گوگل خواب میبینه
مهم نیست چند بار این کار و کنی یا به چی فک کنی هر جا رو نیگا کنی اگه رو دوز بالای ال اس دی باشی دقیقا !! اینجوری میبینی
من اصلا نمیدونم اینجا چه خبره اون چرا باید تو رویاش مثل بیداری ما رو اسید ببینه
i mean
what the fu***ck is really going on !!? -
whatever