آیا گوگل خواب گوسفند برقی می‌بیند؟

21
این مطلب به بوک‌مارک‌ها اضافه شد
این مطلب از بوک‌مارک‌ها حذف شد

گوگل به جایی رسیده که یادگرفته مثل شما رویاپردازی کند!

این روزها هشتگ #deepdream خیلی داغ شده و بسیاری از کاربران شبکه‌های اجتماعی به انضمام چنین هشتگی تصاویری دهشتناک و کابوس‌وار ضمیمه می‌کنند.

اگر نمی‌دانید قضیه از چه قرار است با ما همراه باشید چون نیت کرده‌ایم که مختصر و مفید کل ماجرا را از اول تا آخر برایتان توضیح بدهیم.

فقط علی‌الحساب بدانید که گوگل یک هنرمند سوررئالیست نشده و قرار هم نیست که کسی بر کل کره‌ی زمین اسید بپاشد (این را حقیقتاً خیلی هم مطمئن نیستم) و این تصاویری که دست به دست می‌شوند محصول دستکاری ژنتیکی یا آلودگی هوا هم نیستند (حالا که نگاه می‌کنم همین را هم نمی‌توانم خیلی تضمین کنم).

1327370355576834917

قضیه از چیزی که شما فکر می‌کنید بسیار ساده تر است:

گوگل به جایی رسیده که یادگرفته مثل شما رویاپردازی کند!

6e8d3c57-f283-4f63-94cd-9299a160f80d-620x372

«ال‌وی‌ایکس-1» آهسته گفت:

– من دیشب خواب دیدم.

«سوزان کالوین» چیزی نگفت، ولی خطوط چهره‌ی این دانشمند سالخورده لحظه‌ای دگرگون گشت.

«لیندا راش»، جوان ریزنقشِ سیه‌مو، در حالی که دست راستش را پی در پی باز و بسته می‌کرد، با عصبانیت گفت:

– شنیدی؟ این همانی‌است که درباره‌اش می‌گفتم.

..

– از کجا فهمیدی که خواب دیده‌ای؟

– دکتر «کالوین»، به هنگام شب که همه جا تاریک می‌شود، ناگهان روشنایی‌ای به چشمم می‌خورد. روشنایی‌ای که هیچ علتی برای پدیدآمدنش وجود ندارد. چیزهایی می‌بینم که به واقعیت ربطی ندارند. چیزهایی می‌شنوم و واکنش‌های عجیبی انجام می‌دهم. برای درکشان به «دائره‌المعارف» مراجعه کردم و به مدخل «خواب و رویا» رسیدم. وقتی که لغت به لغتش را بررسی می‌کنم بیشتر مطمئن می‌شوم که آنچه دیده‌ام «خواب» نام دارد.

خب حالا که با بخشی از داستان «ربات خواب می‌بیند» عالی‌جناب «آسیموف» غافلگیرتان کردم به نظرم وقتش شده که قصه‌ی هوش مصنوعی را با هم مرور کنیم (البته می‌توانید بقیه‌ی داستان را با ترجمه‌ی محمد حاج زمان در شگفتزار بخوانید):

قصه‌ی هوش مصنوعی

همه‌چیز از  یک ماشین محاسباتی عظیم شروع شد که «الن تورینگ» برای مبارزه با «ماشین انیگما» اختراعش کرد (بی‌خیال! یعنی می‌خواهید بگویید که بازی تقلید را ندیده‌اید The Imitation Game؟).

alan-turing

انیگما یک ماشین مکانیکی پیچیده بود که برای تبدیل کردن یک پیام به «رمز» و دوباره بازگشایی کردن همان رمز به کار می‌رفت. در زمان جنگ جهانی دوم نازی‌ها یک نوع از همین انیگماها را برای خودشان توسعه دادند که «انیگمای ورماخت» نام داشت و تصورش را نمی‌توانید بکنید که ناتوانی متفقین دربرابر همین اسلحه‌ی ساده نزدیک بود که به قیمت از دست دادن کل اروپا تمام شود. اینجا بودکه آلن تورینگ وارد شد، همانی که زودتر از بقیه‌ی دانشمندان پرسید:

آیا روزی به جایی خواهیم رسید که از خود بپرسیم: «آیا ماشین هوشیار است و می‌تواند فکر کند؟»

آلن تورینگ در بلچلی پارک (مرکز کدشکنی انگلستان) مشغول پیداکردن راهکارهایی برای شکستن کدهای آلمانی‌ها بود که در نهایت یک ماشین الکترومکانیکی (Bombe) ساخت که می‌توانست بسیار زودتر از هر آدمی روش رمزنگاری انیگما را پیدا کند. اما خدمات او به همین محدود نشد و در سال 1936 هم ماشینی فرضی معرفی کرد که بعدها ماشین تورینگ نام گرفت و مسیر پیدایش ماشین‌های محاسباتی را هموار کرد.

ماشین تورینگ  علامت‌های بر روی یک قطعه نوار بلند را بر اساس جدول قوانین می‌خواند و دست‌کاری می‌کند، یعنی ماشین سه بخش دارد که شامل نوارخروجی، نوار ورودی و پردازنده‌ی مرکزی می‌شود.

به نظرتان خیلی ساده می‌آید؟ خب حقیقت این است که غالب کامپیوترهای پیش‌رفته‌ی امروزی هم همچنان با مکانیزم ماشین تورینگ قابل توضیحند. در واقع اکثر الگوریتم‌های کامیپوتری دقیقاً تابع فرمولی هستند که تورینگ برای ایجاد هوش‌مصنوعی و انجام دستورات دقیق ابداع کرد.

800px-Maquina

تورینگ  مقاله‌ی معروفش در سال ۱۹۵۰ را با این پرسش شروع کرد که: «آیا ماشین‌ها می‌توانند فکر کنند؟» ولی سوالش را بلافاصله با سوال دقیق تری جایگزین کرد که:

«آیا ماشین‌ها می‌توانند از بازی تقلید سربلند بیرون آیند؟»

البته بعد از جنگ کسی تورینگ را تحویل نگرفت و به بهانه‌ی طبقه‌بندی بودن اطلاعات، اختراعش مهر و موم شده ماند و هیچکس متوجه نشد که این وسیله‌ی ظاهراً ساده تا چه اندازه مسیر جنگ را دگرگون کرده. نه تنها از او به عنوان قهرمان جنگی تقدیر نشد که در دادگاهی به بهانه‌ی شائبه‌ی همجنسبازی‌اش به تزریق هورمون محکومش کردند تا کار به جایی برسد که پدر علم محاسبه‌ی نوین و مبدع اصلی هوش مصنوعی، برای خلاصی از عوارض روحی و جسمی هورمون‌ها با خوردن سیبی آغشته به سیانور خودکشی کند. شاید همان سیب گاززده‌ای که امروز لوگوی شرکت «اپل» شده.


آیا ماشین تورینگ همان چیزی بود که آسیموف هشدارش را می‌داد؟

کامپیوترها خیلی زود در محاسبات ریاضی از ما جلو زدند و از خیلی وقت پیش مطمئن شده‌ایم که در حل معادلات دیفرانسل مرتبه بالا به گردشان هم نمی‌رسیم. اما درست وقتی که همه‌ی دانشمندان از روند پرشتاب رشد هوش مصنوعی شگفتزده شده بودند، با حقایق ناامیدکننده‌ای هم روبرو شدند.

وقتی نسل‌های ابتدایی روبات‌ها را در یک اتاق آزمایشی مورد آزمون قرار می‌دادند، ساعت‌ها طول می‌کشید تا راه خروج را تشخیص بدهند. تازه آن هم اتاقی که فقط شامل بر اشکالی همچون مربع و مثلث می‌شد و مسیر خروج تابعی از خطوط مستقیم تعریف شده بود. اگر هم که کسی یک دست مبل منحنی با اشکال غیرهندسی کنار ربات می‌گذاشت نتیجه از قبل هم ناامید‌کننده‌تر می‌شد. بعد در همان حال که روبات دیگر داشت کلافه می‌شد، پشه‌ای که مغز کوچکش فقط ۲۵۰.۰۰۰ نورون دارد از روی شانه‌های روبات پرواز می‌کرد و در مسیری آرام و مطمئن بیرون می‌رفت. آن زمان دیگر عده‌ای مطمئن شده بودند که تقدیر این است که روبات‌‎ها همیشه اینقدر احمق بمانند.

ریشه‌ی این مشکل به شیوه‌ی مرسوم آموزش هوش مصنوعی آن موقع یعنی «روش کل به جزء» بر می‌گشت. یعنی در واقع می‌توان گفت که روبات‌هایی که به شیوه‌ی تورینگ آموزش می‌دیدند عملکردهای جدید را یاد می‌گرفتند ولی نمی‌فهمیدند. 

شاید بهتر باشد که این وضعیت را این گونه توضیح بدهیم که یک هوش مصنوعی آموزش‌دیده از طریق کل به جزء، مثل یک توریست خارجی می‌ماند که به چین سفر کرده، بی‌آنکه یک کلمه چینی بداند. اساتید هوش مصنوعی هم برای این که توریست بیچاره گم نشود، کتابی دستش داده‌اند که «چینی در سفر» نام دارد. توریست ما (همان هوش مصنوعی مورد نظر) هر جا که گیر می‌افتد به مدخل‌های کتابی که به او داده‌ایم رجوع می‌کند: چگونه احوالپرسی کنیم؟ چگونه ساعت را بپرسیم؟ چگونه ادرس را بپرسیم؟ محاوره در رستوران. محاوره با یک پلیس و…

پس توریست ما وقتی که غذا می‌خواهد می‌گوید: Wǒ xūyào shíwù ولی هیچ ایده‌ای ندارد که تک تک این کلمات چه هستند و به چه کاری می‌آیند. یک مشکل دیگر این است که تمام چیزهایی که در کتاب راهنما آمده‌اند برای یک شرایط فرضی خاص‌اند و ممکن است توریست ما وقتی که با یک چینی‌ای که لهجه‌ی دهاتی دارد روبه‌رو شود از نا بیفتد ولی یک کلمه از حرف‌های او را متوجه نشود. باز  بسیاری شرایط دیگر امکان دارند که شاید اصلا در کتاب نباشند و یا که باشند ولی جست‌و جویشان در صفحات کتاب وقت زیادی بگیرد.

حتی هیمن الان که شما مغشول خاوندن این کملات هتسید دادیر کاری اجنام می‌هدید که به صروت ممعول برای هوش منصوعی‌های اولیه غیر مکمن بود.

شما به واسطه‌‎ی میلیون‌ها سال تکامل به نقطه‌ای رسیده‌اید که در تشخیص الگوها و حتی شناسایی الگوهای ناقص به درجه‌ی استادی رسیده‌اید. تصور کنید که وقتی در جنگلی انبوه مشغول پیاده‌روی هستید و ببری به شما حمله‌ور می‌شود، تشخیص این که آن اعوجاجِ چشم‌دارِ بین برگ‌ها یک حیوان وحشی خطرناک است برای شما در آنی صورت می‌پذیرد ولی یک کامپیوتر کلاسیک باید میلیون‌ها خط دستور اجرا می‌کرد تا تشخیص بدهد که نیاز است که احساس خطر کند یا نه!

شما وقتی که در یک استادیوم شلوغ برای لحظه‌ای دوستتان را گم می‌کنید بلافاصله از میان نویز سنگین هزاران تماشاگر پر سر و صدای دیگر صدای رفیقتان را تشخیص می‌دهید و جهت و فاصله‌ی او را هم فوراً تخمین می‌زنید. این نوع پردازش همان چیزی است که محققین هوش مصنوعی آرزویش را داشتند. همان چیزی که «پردازش صوت و تصویر و داده»  و «کنترل روبات‌ها و سیستم‌های قدرت و یا مخابرات» و «هدایت وسایل نقلیه‌ی هوشمند» را ممکن می‌کرد.

shutterstock_293002580_1080

بعد از این احساس نیاز برای چندین دهه ارتش آمریکا میلیون‌ها دلار خرج می‌کرد تا سرباز مکانیکی و خودروی هوشمند بسازد، ولی نتیجه نگرفت. حتی در اوج خوش‌بینی‌ها که برنامه‌ی کامپویتری دیپ بلو (Deep Blue) گری کاسپاروف را در بازی شطرنج شکست داد، دانشمندی به نام «دوگاس هوفسواتر» گفت:

خدای من! فکر می‌کردم بازی شطرنج همیشه نیازمند فکر کردن باشد و حالا فهمیدم که نه.  در  واقع می‌توان پرواز کرد بی‌آنکه پر زد.

هوفسواتر و باقی محققین علوم کامپیوتری عقب ماندگی شدید هوش‌های مصنوعی را در برابر هوش طبیعی درک می‌کردند چون می‌دانستند هنوز چه راه طولانی‌ای مانده تا بشود گفت یک ماشین باشعور ساخته‌ایم. تصور کنید در همان کتاب راهنمای آقای توریستمان تک‌تک دانسته‌های لازم برای باشعوربودن (common sense) را هم بنویسیم، که مثلاً:

آب تر است / حیوان از درد خوشش نمی‌آید / کسی که بمیرد دیگر برنمی‌گردد / نخ فقط کش می‌آید / زمان فقط به جلو می‌رود و ده‌ها میلیون کد دیگر.

اما اگر بر فرض بعد از ده‌ها سال تمام محتویات شعور را در دائره‌المعارفمان گرد کردیم و باز بر فرض محال توانستیم که به‌روز هم نگهش داریم، آیا باز با کوچکترین تغییر (نویز) روند آموزشمان به هم نمی‌خورد؟ که کامپیوتر بپرسد:

به چه مایعی آب گفته می‌شود؟ چند درصد باید H2O در آن موجود باشد؟ آیا مایع قهوه‌ای روان در جوی هم آب است؟ پس چرا یخ که از H2O است به اندازه‌ی آب تر نیست؟

پیش‌بینی آب و هوا با تحلیل حجم عظیمی از داده‌های ماهواره‌ای برای هوش‌های مصنوعی امروزی مثل آب خوردن است ولی آیا واقعاً می‌توان بهشان حالی کرد که هرزه‌نگاری چه تفاوتی با نقاشی‌های برهنه‌ی دوره‌ی رنسانس دارد؟


مگر درون مغز ما چه خبر است که روبات‌ها از تقلیدش عاجزند؟

از آن دوران که مصریان موقع مومیایی کردن محتویات درون جمجمه که بی‌ارزش می‌پنداشتند را بیرون می‌ریختند زمان بسیاری گذشته؛ از دوران جالینوس هم که سه حفره در جمجمه یافته بود و ایشان را مسئول تصور و عقل و حافظه می‌دانست؛ از دوران دکارت هم که مغز را یک ماشین هیدرولیکی توصیف می‌کردند. که حالا می‌دانیم مغز توده‌ایست به حجم 300cm^3 و وزن 1/5KG و تنها یکی از اجزای سیستمی پیچیده شناخته می‌شود و حتی به شکل نخاع  در امتداد ستون فقرات ادامه می‌یابد و عصب‌هایی منتشر می‌کند که از همه جای بدن می‌آیند و به همه جای بدن هم می‌روند. در واقع مغز خیلی فراتر از یک CPU ساده است که ماشینیست ساخته شده از مولکول‌های آلی، پروتئین‌ها، لیپیدها، کربوهیدرات‌ها، عناصر نشانه و مقدار زیادی آب نمک که با رشته‌ای از فرآیندهای الکتریکی و شیمیایی زنجیره‌ای عمل می‌نماید.

یعنی برخلاف کامپیوتر شما که هیچ اهمیتی ندارد که قطعاتش فلزی، پلاستیکی و یا سیلیکونی باشند، مغز شما دقیقاً همان چیزهایی است که ساختمانش را تشکیل می‌دهند.

Neurons-Brain

کوچکترین واحد عملیاتی مغز نورون‌ها هستند که وظیفه‌ی تحلیل سیگنال‌های الکتریکی درون مغز به عهده‌ی آن‌هاست. برای این که تفاوت عملکرد مغز را با یک رایانه‌ی معمولی متوجه بشویم ناگزیریم یک مثال دیگر را به ذهن بیاوریم. تصور کنید که مغز کشوری گسترده باشد که همیشه مورد تهدید حمله‌ی وحشی‌هاست. در یک کشور عادی (مثل کامپیوتر) اطلاعات جمع می‌شوند و  فرمانده‌ی کل قوا تشخیص می‌دهد که بر اساس شرایط حال حاضر و قواعد جنگی چه فرمانی داده شود (مثلاً کتاب «هنر جنگ» که حاوی مجموعه‌ای از برنامه‌ها و استراتژی‌های از پیش‌تعیین‌شده است). اما در کشور مغز برخلاف آن کشور عادی هیچ فرمانده‌ی متمرکزی وجود ندارد!

در کشور مغز اولین نورونی که احساس خطر کرد مثل سرخپوست‌ها اتشی بزرگ بر فراز تپه‌ای روشن می‌کند تا نورون‌های آن حوالی را با خبر کند. یعنی مغزی‌ها یا به حساب نورون‌ها با ابتدایی‌‎ترین وسیله‌ی ممکن یک‌هو تصمیم می‌گیرند که کشورشان مورد هجوم وحشی‌ها قرار گرفته و یا نه و باز در آن واحد بی‌آنکه لازم باشد اطلاعات را به فرمانده‌ی کل قوایی ارائه بدهند واکنش هم نشان ‌می‌دهند. شاید راز این معما در رفتارهای گوناگون مغزی‌ها باشد چون که ما حالا می‌دانیم همه‌ی نورون‌ها خلق و خویی یکسان ندارند. بعضی زودباورند و بعضی هم بسیار دیر چیزی را می‌پذیرند. مثلاً نورونی به اسم «آقای یک» ممکن است تا هشداری از سمت «آقای دو» ببیند آتشش به راه شود ولی بر اساس تجربیات گذشته هیچ اهمیتی به آتش‌هایی که «آقای سه» روشن می‌کند ندهد. بعضی نورون‌ها هم هستند که تا ده‌ها آتش روشن نبینند پیام خطر را مخابره نمی‌کنند ولی در عوض آتشی که روشن می‌کنند ممکن است دود بسیار بیشتری داشته باشد و نورون‌های بیشتری را در آن حوالی به هول و ولا بیندازد.

پس مغز کشوریست که به جای داشتن یک فرمانده مقتدر ترجیح داده که مسائل دشوار را بین سربازهایی بسیار عادی پخش کند. ماشینی که دشوارترین مسأله‌ها را به ساده‌ترین اجزا واگذار می‌کند. عناصر عملیاتی‌ای که همگی موازی هم کار می‌کنند و شبکه همیشه و در همه حال بر مبنای تطابق و همسنجی بین ورودی و هدف سازگار می‌شود. وقتی یک نورونی بالاتر از یک مقدار معینی تحریک شود برانگیخته می‌شود به طرزی که یک ولتاژ عملکرد را در طول مسیر بازوهایش آزاد می‌کند (Action Potential یا به حساب همان آتش سرخپوستی). آتش که به انتهای بازو رسید تبدیل به دود می‌شود یعنی در واقع ولتاژ عملکرد سبب ترشح پیام‌رسان‌های عصبی یا نروترنسمیترها (Neurotransmitters) خواهد شد که نروتسمیترها همان زبان مشترک و قابل تفسیر بین نورون‌هایند. گفتنی است یکجای مثال ما می‌لنگد چون برخلاف دود آتش سرخپوستی، نروترنسمیترها دو نوع دود دارند: سیگنال تحریک کننده و سیگنال مهار کننده.

800px-Frederic_Remington_smoke_signal

 هر نورونی اطلاعاتی که به زبان نروترنسمیتری هستند را از همه طرف خودش جمع می‌کنند و اگر قانع شد خودش هم آتش دیگری روشن می‌کند تا مسیر ادامه یابد. نتیجه این که فرآیند  آموزش چیزی نیست جز تجربیات نورون‌ها در شناختن نورون‌های همسایه. پس چیزی که ما به آن یادگیری می‌گوییم فرآیندی بسیار ساده است که با تشکیل الگوهایی از اتصالات بین نورون‌ها شکل می‌گیرد، یعنی گاهی با ایجاد اتصالات جدید بین بعضی از نورون‌ها میسر می‌شود و  گاهی با قطع شدن همزمان اتصالات قدیمی دیگری یا که شدید و یا ضعیف شدن شدت اعتماد نورونی به نورون دیگر.

حالا در نظر بگیرید که 1011 تعداد نورون در مغز شماست که هر نورون ۱۰۰۰ بازوی ورودی (دندریت) دارد پس در نتیجه ما «۱۰۰۰ ضربدر  1011» اتصال (سیناپس Synapse یا همان نقاط همسایگی‌) در مغزمان داریم. باز در نظر بیاورید که نورون‌های ما در هر ثانیه می‌توانند صدبار آتش کنند که حالا قابل توجیه است که چرا عضوی که فقط 2 درصد از بدن را تشکیل می‌دهد ۲۰ درصد از انرژی‌اش را مصرف می‌کند. زیرا که بیشتر این انرژی صرف تقویت پیام‌های الکتریکی (یا در مثال برپا کردن آتش سرخپوستی) در طول رشته‌های پیچیده‌ای از بازوها می‌شود که چنان شبکه‌ی عظیمی‌اند که اگر قرار باشد تمام این بازوهایی موجود در مغز یک انسان را از هم باز کنیم و به هم گره بزنیم، روبانی بلند درست خواهد شد که می‌توانیم با آن دوبار  محیط کره‌ی زمین را دور بزنیم.

حالا برگردیم و یکبار دیگر مرور کنیم که در بالاخانه‌ی یک موجود بیولوژیک چه خبر است:

۱- تعداد بسیار زیادی ارتباط موازی بین نورون‌ها وجود دارد

۲- خروجی لزوماً بله یا خیر نیست و ماهیت باینری ندارد (درواقع می‌توان گفت رابطه‌ی بین نورون‌ها وزن‌دار است).

۳- برخی از نورون‌ها می‌توانند نورونی را تحریک کنند ولی همزمان عملکرد نورون دیگری را مهار کنند.

۴- تحلیل مرکزی وجود ندارد و مغز با از دست دادن تعدادی نورون عملکرد خودش را هرگز از دست نخواهد داد.

۵- عملکردها همزمان نیستند.

۶- برنامه‌ای را اجرا می‌کنند که به طور کامل توزیع شده است و به شکل چندقسمتی اجرا می‌گردد.

بله دقیقاً همین جاست که شما تصویر صورت دوستتان را تشخیص می‌دهید، ما بین همین اتصالات است که شوخی جدیدی به ذهنتان می‌رسد و یا بحث فیلسوفانه‌ای نو نطفه می‌اندازد و همین خصوصیات‌های ظاهراً ساده بود که از حیطه‌ی نورولوژی و علوم شناختی به مهندسی فراخوان شدند و کمک کردند که ما به جایی برسیم که چیزهایی مثل کورتانای مایکروسافت و یا سرویس‌های ترجمه‌ی همزمان جدید اسکایپ و یا نرم‌افزار تشخیص و بهینه‌سازی تصاویر گوگل ساخته شوند.


بالاخره شبکه‌های عصبی مصنوعی

پنجاه سال پیش که ما بالاخره به قدرت مغزهای بیولوژیکی ایمان آوردیم، به نقطه‌ای رسیدیم که جرات کنیم برنامه‌هایی بنویسیم و مداراتی بسازیم که قادر باشند شبکه‎های عصبی زیستی را همانندسازی کنند. بله! بازی تقلید شروع شده بود.

اولین مدل ریاضی شبکه‌های عصبی توسط مک کلاچ (عصب‌شناس) و پیتز(متخصص آمار) در سال ۱۹۴۳ ارائه شد که هیچ کاربردی نداشت و فرآیند یادگیری و سازگاری برایش اصلاً تعریف نشده بود. گام مهم بعدی را روزنبلت در سال ۱۹۵۸ برداشت که نتیجه‌ی شبیه‌سازی او به عنوان اولین نمونه‌ی موفق شبکه‌های عصبی مصنوعی معرفی شد. شبکه‌ی عصبی مصنوعی روزنبلت (مشهور به مدل پرسپترون) از پس بسیاری از مسائل طبقه‌بندی و تخمین برمی‌آمد. اگر بخواهیم روش کار نمونه‌های اولیه‌ی شبکه‌ی عصبی مصنوعی (Artificial Neural Networks به اختصار ANN) را تا حدودی درک کنیم، ناگزیریم که به مثال زیر متوسل شویم. البته این مسأله  به دلیل وجود نویز و خطای بسیار در واقعیت چندان کاربردی نیست، ولی به خوبی اساس منطق یک شبکه‌ی عصبی مصنوعی را توضیح می‌دهد:

(اگر حوصله ندارید یا خیلی به موضوع علاقه‌مند نیستید، می‌توانید علامت ضربدر را بزنید و بی‌خیال خواندن این مثال بشوید)

فرض کنید که قرار است شما قاعده‌ای را برای تخمین شغل مردم پیدا کنید. روش کار بدین گونه است که چندنفر را جمع می کنید و به میزان علاقه ی ایشان به سریال پیشتازان فضا نمره می‌دهید (ورودی یک) و توانایی ریاضی‌شان را هم در آزمونی محک می زنید (ورودی دو) . حال از تک تک ایشان شغل حقیقی شان را می پرسید تا مکان هر کس در نمودار مشخص شود.  حالا بعد از چندبار آزمون و خطا سعی می کنید خطوط همرسی بکشید تا افرادی با مشاغل متفاوت  به صورتی صحیح دسته‌بندی شوند. پس حالا با وجود همین خطوط می‌توانیم ادعا کنیم که در حالتی ایده‌آل اگر هر کس دیگری را هم از خیابان بیاورند و از او درباره‌ی میزان علاقه‎اش به پیشتازان فضا و توانایی‌اش در ریاضی پرس و جو کنند، شما می‌توانید بر اساس ورودی‌ها جایش را در نمودار پیدا کنید و شغلش را حدس بزنید بی‌آنکه هیچ تقلبی در کار باشد (یعنی می‌توانیم یادگیری‌مان را تعمیم بدهیم). اگر هم برفرض شغل غریبه‌ای که شما حدس زدید اشتباه درآمد باید باز برگردیم و اندکی خطوط را جا به جا کنیم تا سرانجام خطوط به جایی برسند که هر داده ی جدیدی را پوشش بدهند تا در نهایت با کمترین خطا از پس وظیفه‌ی خودمان بربیاییم.

بنا به این تئوری اگر ما به اندازه‌ی کافی شبکه‌مان را آموزش دهیم بالاخره شبکه به جایی خواهید رسید که با تغییر پارامترهای خود (در مثال  همان خطوط  همرس کشیده شده بر نمودار) بتواند خروجی شبکه را از خروجی‌های اشتباه اولیه، به سمت خروجی‌های مطلوب همگرا کند. به همین ترتیب زود توانستند به شبکه‌‌ی روزنبلت آموزش بدهند که چگونه اشکال مربعی را از اشکال غیر مربعی تشخیص بدهد بی‌آنکه نیاز باشد تمام حالت‌های ممکن مربع بودن یا نبودن را برایش تعریف کنند. ولی مشکل از آنجا شروع شد که قرار بود کامپیوتر غیر از اینکه مثلاً تشخیص بدهد شکل مربع است یا نه، همزمان مربع‌های قرمز را هم از مربع‌های غیر قرمز جدا کند. در واقع اگر بخواهیم به همان مثال قبلی‌مان برگردیم، حالت پیچیده‌تری شبیه شکل زیر وجود دارد که ممکن نیست  صرفاً با کشیدن همان یکدست خطوط همرس قبلی، بتوانیم طبقه‌بندی‌مان را  کامل کنیم (یعنی به خطوط همرس بیشتری نیاز داریم).

همین مشکل علی‌الظاهر بسیار ساده (مشهور به The XOR saga)، برای چندین دهه پیشرفت هوش مصنوعی را متوقف کرد (گرچه ضعف پردازنده‌های مورد استفاده‌ در آن دوران هم مزید بر علت بود).

 اما برخلاف روند ظاهراً متوقف تحقیقات هوش مصنوعی، زیست‌شناسان از مطالعه بر روی هوش بیولوژیکی دست نکشیدند و با تحقیق در زمینه‌ی فرآیند بینایی، از رموز اساسی نوروساینس  پرده برداشتند. در واقع در همان دهه شصت میلادی دانشمندان فهمیدند که اعصاب بینایی  با معماری‌ای بسیار لایه‌درلایه‌تر از آن چه تصور می‌شد بینایی را امکان‌پذیر می‌کنند. یعنی نورون‌های شبکیه مسئول تشخیص نقاط تاریک و روشنند ولی نورون‌های قشر اصلی بینایی مغز به اشکال و زوایا واکنش نشان می‌دهند و نورون‌های قشر پایینی هم اشیای پیچیده‌ای مثل چهره و دست و پا و … را می‌فهمند.

یعنی مغز اطلاعات را به عناصر پایه‌شان تجزیه می‌کند تا روابط بین آن‌ها را به طور کامل درک کند تا برای مثال وقتی شما به تصویری خیره می‌شوید این طور نباشد که مغزتان با اطلاعات انبوهی از نقاط رنگارنگ روبرو شود، بلکه شما خطوط، لکه‌ها، رنگ‌ها و روابط بینشان را جداگانه می‌بینید.

پس در طبقات اولیه‌ی بینایی فقط خصوصیات ساده‌ای همچون موقعیت و لبه و شدت نور  واکاوی می‌شود و فقط در مراحل بعدتر است که مشخصه‌های پیچیده‌تری مثل حرکت و رنگ‌ها مورد بررسی قرار می گیرند.

 همین دستاورد به روندهای شناختی دیگر مغز مثل فرآیند تشخیص زبان هم تعمیم داده شد تا با توجه به همین دستاوردها مدل سازی شبکه های عصبی مصنوعی به سمت مدل‌های با پردازش‌های سازمان‌یافته‌ی لایه‌ای بروند. مدل‌هایی که یادگرفته بودند مرحله به مرحله یاد بگیرند و باز مرحله به مرحله برگردند تا خطاهای شبکه را تعدیل کنند.

400px-Artificial_neural_network.svg

با در نظر گرفتن این الگوی جدید رفتار نورون‌ها، بازی تقلید به مرحله‌ی خطرناک‌تری رسید. نرم‌افزار‌ها یاد گرفتند که مثلاً برای شناسایی تصویر، در لایه‌ی اول فقط روشنایی پیکسل‌ها را پردازش کنند تا لایه‌ی بعدی هم خطوط و زوایا را تشخیص بدهد و همین‌طور زنجیروار به شناختی عمیق‌تر برسند تا اشکال پیچیده‌ای مثل چشم یا چرخ قابل درک شوند. برای رفع همین نیاز است که گوگل اعلام کرده در نرم افزارتصاویر گوگل (Google Photos) سی لایه شبکه‌ی عصبی به کار بسته.


گوگل باهوش می‌شود

حالا دیگر روش کار را یاد گرفته بودیم و کامپیوترهایمان هم اینقدر قدرتمند شده بودند که دیگر مانعی بر سرکار نباشند، پس تنها چیزی که مانده بود مقادیر عظیمی از داده بود تا به خورد هوش مصنوعی نوزادمان بدهیم. راستش این همان بخشی بود که بی کمک من و شما میسر نمی‌شد. مجموعه‌ی آموزشی هوش مصنوعی معظمی همچون گوگل، چیزی نبودند جز ویدئوهای یوتیوب شما، یا عکس‌هایی که قبلاً پست کرده‌اید و کنارش تصویر را هم توضیح داده‌اید. هوش مصنوعی تازه متولد شده، ویدئوها را یکی یکی می‌دید و در لایه‌های مختلفش پردازش می‌کرد، سپس چیزهایی را که شنیده بود یا دیده بود را حدس می‌زد و سرآخر جوابش با جواب یک انسان واقعی مقایسه می‌شد تا با فهمیدن خطاهایش دنبال اصلاح متغیرهای درون شبکه بیفتد.

شبکه‌های عصبی مصنوعی خیلی زود یادگرفتند که صبور باشند و به جای حفظ کردن، درک بکنند (یادگیری عمیق Deep Learning) و در صورتی که متوجه اشتباه بودن تشخیص خودشان شدند، یکی یکی لایه‌ها را برگردند و مقادیر را دستکاری کنند تا پاسخ خطایشان دوباره تکرار نشود (یادگیری پس‌انتشار Back-Propagation). این طور بود که نرم‌افزار تشخیص گفتار گوگل (مبتنی بر شبکه‌های عصبی مصنوعی) در سال 2011 با درصد خطایی در حدود 25 درصد به نمایش گذاشته شد (از هر چهار تصویر یکی را اشتباه تشخیص می‌داد)، ولی همین نرم‌افزار بعد از سه سال آنقدر پیشرفت کرد که حالا فقط 8 درصد خطا دارد.

البته فقط گوگل از شبکه‌های عصبی مصنوعی بهره نبرد که فیس‌بوک هم الگوریتم DeepFace را معرفی کرد که فقط با سه درصد خطا از پس تشخیص چهر‌ه‌ی انسان برمی‌اید. Wolforam Alpha هم نرم‌افزاری ساخت که می‌تواند اشیاء را شناسایی کند و مایکروسافت هم دستیار صوتی‌اش یعنی کورتانا را به جایی رساند که فرق بین تصویر دو سگ مثلاً از خانواده‌ی پمبروک ولش کورگی و کاردیگان ولش کورگی را راحت متوجه می‌شود.

اسکایپ هم با توسل به همین الگوریتم‌ها ترجمه‌ی همزمان را برای مکالماتش راه‌اندازی کرده، موتور جست‌وجوی چینی (Baido) در حال هدفمندسازی تبلیغاتش با به کارگیری همین روش است و باز گوگل بات چتی (ChatBot) درست کرده که خیلی بهتر از قبل از پس مکالمه‌های عادی برمی‌آید.

البته اگر احیاناً شما آسیموف هستید که این جملات را می‌خوانید، باید بگویم که جناب آسیموف! هنوز نباید خیلی بترسید چون  تا پایان مقصد راه بسیار طولانی‌ای مانده. نشان به آن نشان که نرم‌افزار Google Photo هنوز در تشخیص یک فرد سیاه‌پوست از گوریل دچار اختلالاتی‌ هست. حتی نرم‌افزار تشخیص تصویر فلیکر که به مدد یاهو توسعه یافته، در موردی یک مرد رنگین‌پوست را شامپانزه تشخیص داد. البته اگر از زاویه‌ی دیگری به مساله نگاه کنیم ممکن است به این فرضیه برسیم که شاید هوش‌مصنوعی‌‌ها نژادپرست شده‌اند! (گوگل این مشکل را فعلاً با برداشتن تگ گوریل رفع کرده)


 پس ماجرای خواب دیدن گوگل چه شد؟

شبکه‌ی عصبی هوش مصنوعی گوگل که حالا با هزاران هزار تصویر مختلف آموزش داده شده، جدیداً خواص عجیبی از خودش نشان داده.

مثلاً محققین گوگل فهمیده‌اند که هوش مصنوعی‌ای که ساخته‌اند نه تنها می‌تواند الگوهای مختلف را تشخیص بدهد، که می‌تواند با شنیدن اسم اشیاء مختلف، آنها را مثل تصاویر زیر تصور بکند!

1302697548226939027


اگر یادتان باشد چند سطر قبل گفتیم که هوش مصنوعی با تقلید از روند زیستی هوش انسان، به سمتی رفته که در لایه‌های اول خصوصیات ساده‌‎ای مثل روشنایی، خطوط و زوایا را نشخیص می‌دهد. حالا فرض کنید که از یکی از همان لایه‌های اولیه بخواهیم که قضاوت خودشان را درباره‌ی یک تصویر خاص به ما نشان بدهند:

1302697548279136403


باز فرض کنید حالا از لایه‌های بالاتر که برای تشخیص تصاویر پیچیده‌تر آموزش دیده‌ شد‌ه‌اند (فرض کنید لایه‌ای یادگرفته باشد فقط حیوانات را تشخیص بدهد)، طلب کنیم که تصورات خودش  از یک عکس دیگر را نشان‌مان بدهد. این مثل حالتی است که شما برای چندثانیه به یک شیء خاص خیره بمانید و بعد یک دفعه به آسمان نگاه کنید.

شما می‌توانید این قضیه را به عنوان بیماری تشخیص الگو به یاد بسپارید (مثل وقتی که به ستاره‌ها خیره می‌شویم و از چیدمانشان چهره‌ی یک آدم را شناسایی می‌کنیم. یا مثل وقتی که در اشکال اتفاقی ابرها یا حتی سطح معوج کره‌ی ماه تصاویر دوستان و یا الگوهای آشنا  را می‌یابیم.  در واقع هم ما و هم گوگل زیادی عادت کرده‌ایم که دنبال الگوهای آشنا باشیم):

1302697548325886611

اگر  عکس بالا را بزرگنمایی کنیم از دیدن توهمات گوگل حیرت‌زده می‌شوید:

1302697548458347155

بله این موجودات فانتزی رویاهای یک ماشین مصنوعی هستند. حتی گوگل برای این پدیده اسم هم گذاشته Inceptionism!


محققین گوگل باز یک قدم جلوتر رفتند و با ماشینشان یک بازی جدید را تمرین کردند. آن‌ها مثلاً از شبکه‌‌ای که در تشخیص تاق‌های قوسی خبره شده بود خواستند که هر چیزی که از تاق قوسی می‌داند را تصویر کند (این‌ها مثل متخصصانی می‌مانند که هرجا را نگاه کنند تخصص خودشان را می‌بینند)، که نتیجه چیزی شبیه آثار موریس اشر شد (این هنرمند می‌توانست با نقاشی‌های خود سازه‌هایی ترسیم نماید که به نظر غیرممکن می‌رسیدند و به نوعی مفهوم بی‌نهایت را تداعی می‌کردند. مفهوم دیگری که در نقاشیهای این گرافیست زیاد به چشم می‌خورد، مفهوم دگردیسی و تبدیل و تناسخ یک موجود به موجودی دیگر در زنجیره‌ای بی‌انتهاست):

1302697548523125139


شما هم می‌توانید با رفتن به این آدرس با هوش مصنوعی گوگل ور بروید و برای نمونه یک توهم اسیدی این چنینی از تصویری از سریال بازی تاج و تخت بسازید:

1302697548585961875


یا حتی مدمکس:جاده‌ی خشم:

mad-max-fury-road-google-deepdream

امیدوارم که توانسته باشم روند رسیدن به این تکنولوژی را تا حدودی برایتان شفاف کنم. در پایان از شما دعوت می‌کنم که این ویدئوی ۵ دقیقه‌ای از آنچه در سر گوگل می‌گذرد را تماشا کنید:


نمی‌دانم شاید با این اوضاع باید مثل دکارت در فیلم بلید رانر (Blade Runner فیلمی از  ریدلی اسکات بر اساس داستان  «آیا آدم مصنوعی‌ها خواب گوسفند برقی می‌بینند؟» نوشته‌ی فیلیپ ک. دیک) دنبال راهی برای تشخیص آدم مصنوعی‌های خلافکاری بیفتیم که به شدت شبیه انسانند. در این حد که شاید خواب گوسفند برقی هم ببینند.

andrew-jackson-us-20-bill

اگر دوست دارید که درباره‌ی شبکه‌های عصبی مصنوعی و توسعه روابط ریاضی حاکم بر الگوریتم‌های آن‌ها بیشتر بدانید، من کتاب «شبکه‌های عصبی» نوشته‌ی دکتر فیل پیکتن را توصیه می‌کنم که دکترمیرصالحی و دکتر تقی‌زاده به فارسی ترجمه‌اش کردند و توسط انتشارات دانشگاه فردوسی به چاپ رسیده.

سفید کاغذی
جدیدترین شماره کاغذی سفید را بخرید
شماره ۳: پری‌زدگی
برچسب‌ها:
مشاهده نظرات
  1. M A H B O o B EH

    O_o

    خیلی جالب بود!!! خیلییییییییییی!
    واقعا ممنون. خسته نباشید 🙂

    1. م.ر ایدرم

      خواهش می‌کنم. خوشحالم خوشتون اومده 🙂

  2. مجید دهقان

    مطلب خیلی خیلی جالبی بود. دستتون درد نکنه

    1. م.ر ایدرم

      خواهش می‌کنم. خیلی خیلی باعث خرسندیه که شما مقاله رو دوست داشتید.

  3. ناشناس

    زحمت کشیدی برای مطلب، تشکر خیلی خوب بود.

    1. م.ر ایدرم

      خواهش می‌کنم دوست عزیز. قابلی نداشت. امیدوارم ما رو دنبال کنی همچنان

  4. ginko

    دهنش سرویس!

    1. م.ر ایدرم

      😀

  5. فاصله

    خیلی کامل بود! و البته جذاب!:)

    1. م.ر ایدرم

      خوشحالم که خوشتون اومد و براتون مفید بود
      امیدوارم همچنان دنبالمون کنید

  6. gryphiz

    ممنون

    1. م.ر ایدرم

      خواهش می‌کنم
      و ممنونم که ما رو می‌خونید

  7. ناشناس

    چقددددددددر مطلب جدید و جالبی بود !
    واقعاً جزء معدود مطالبی بود که تا آخرش با کنجکاوی و لذت خوندمش
    مرسی که به اشتراک گذاشتین این مطلب رو

  8. رامین زمانی

    مطالب بسیار جالبی نوشته اید. از خواندن این مطلب خیلی لذت بردم. موفق باشید.

  9. ناشناس

    من اینجور مطالبو واقعا دوست دارم ممنون از بهاشتراک گذاری این ها

  10. ناشناس

    خیلی مطلب خاصی بود مخاطب رو جذب میکنه مرسی از شما

  11. ناشناس

    سلام…
    خیلی خوبه که اینجور اطلاعات رو توی اینترنت میبینم. این باعث میشه که اطلاعاتت رو ببری بالا.
    از طراحی سایت شما خوشم اومده…
    امیدوارم اطلاعات این سایت همیشه بروز باشه تا بقیه ازش استفاده کنن…

  12. ناشناس

    هوش مصنوعی به این میگن.

  13. ناشناس

    واقعا این مطلب صحت داره؟ خیلی جالبه

  14. LoopeR

    من الــان یه چیزیو نمیفهمم
    من و سردرگم کرده و راستشو بخوای تا یه حدی ام دلم خالی شده و
    تو استرس دارم این و مینویسم
    ببین من اسید برداشتم
    خیلی زیاد و از تجربه هایی ام که داشتم راضی بود
    ولی یه چیزی که راجب اسید وجود داره اینه که اصلا مهم نیست طیف فکریت چجوری باشه
    دیدن یا همون بصر این شکلیه
    دقیقا همین شکلی که این گوگل خواب میبینه
    مهم نیست چند بار این کار و کنی یا به چی فک کنی هر جا رو نیگا کنی اگه رو دوز بالای ال اس دی باشی دقیقا !! اینجوری میبینی
    من اصلا نمیدونم اینجا چه خبره اون چرا باید تو رویاش مثل بیداری ما رو اسید ببینه
    i mean
    what the fu***ck is really going on !!?

  15. Grobiz

    whatever

نظر خود را بنویسید:

نشانی ایمیل شما منتشر نخواهد شد.

متن نظر:

پیشنهاد کتاب

  • رزونانس

    نویسنده: م.ر. ایدرم
  • خدمات دستگاه هیولاساز دمشقی

    نویسنده: بهزاد قدیمی
  • گریخته: هفت‌روایت در باب مرگ

    نویسنده: گروه ادبیات گمانه‌زن
  • مجله سفید ۲: ارتش اشباح

    نویسنده: تحریریه‌ی سفید