چه وقت کم تر فکر کنیم! بررسی پاره ای از مفاهیم یادگیری ماشینی از یک دیدگاه فلسفی

زمان تقریبی مطالعه 45 دقیقه

معلم ریاضی درس جدید رو شرو‌ع کرد و بدون مقدمه شرو‌ع به نوشتن فرمول کرد، اما من پافشاری کردم که قبل از ارائه فرمول فلسفه آن را شرح دهد، بعد از کمی کش‌مکش مجبور شدم کلاس را ترک کنیم.

در علم منطق دو مفهوم اساسی وجود داره: یک) منطق تصورات که با تعارف سروکار داره دو) منطق تصدیق یا استدلال (منطق علمیه که روش کلان تفکر را‌ به انسان میآموزه). من فلسفه را‌ به عنوان تعریف مفاهیم میشناسم و تصدیق را‌ به عنوان تبدیل تصورات به رو‌ابط ریاضی. یکی از مشکلاتی بزرگی که من به اون در این کلاس بهش خورده گرفتم این بود که قبل از ارایه هر علم باید فلسفه آن شرح داده شه. درسته مطالعه علم منجر به تولید دانش میشه اما فلسفه به ما بینش میده.

به نظر من فلسفه به دو علت مهمه :

1) فلسفه میتونه کمک بسزایی به ما در پرو‌راندن قدرت انتقادیمان کنه 2) روش خوبیست برای یادگرفتن چیزهای خاص است. در این پست سعی دارم یکی از مفاهیم موجود در یادگیری ماشین که زیاد باهاش سروکار داریم به نام بیش‌برارزش که من دوست دارم اون را‌ “پرستش داده” نام گذاری کنم، بپردازم و نشون بدم که داشتن یک دیگاه فلسفی چقدر میتونه ما را‌ در شرح مسایل کمک کنه. نوشتن این مطلب وقت زیادی را از من گرفت، و مطمینا خالی از اشکال نیست، لطفا با تامل بخوانید و نظراتتون را‌ از طریق توییر با من در میان بگذارید.

چه وقت کمتر فکر کنیم!

وقتی چارلز داروین داشت به این فکر میکرد که آیا به دختر خاله خودش، اِما وجوود پیشنهاد ازدواج بده یا نه، یه کاغذ و قلم برداشت و تمامی نتایج احتمالی که ممکنه در آینده رخ بده، را ورانداز کرد.

یک لیست دو سطری تهیه کرد که یک طرف به جوانب مثبت ازدواج مثل فرزند،مصاحبت ، گپ زدن با زن و لذت گوش دادن به موسیقی اختصاص داشت و طرف دیگر آن به وحشت از دست دادن زمان، فقدان آزادی به این مفهوم که هر جا دلش بخواد برود، تحمل بار ملاقات خویشاوندان، خرج و اضطرابی که فرزندان با خودشون به همراه دارند، نگران این موضوع بودن که ممکنه همسرش، لندن را دوست نداشته باشد و اینکه پول کمتری داشته باشد که بخواد کتاب خرید کند. وقتی گزینه هایی که لیست کرده بود را‌ سبک و سنگین کرد، رگه هایی از پیروزی در قسمت جنبه های مثبت ازدواج پدیدار شد و داروین در انتهای لیستش نوشت: “ازدواج،ازدواج،ازدواج Q.E.D “.

Q.E.D مخفف quod erat demonstrandum است که در ریاضی معمولا در انتهای اثبات ها نوشته میشود به معنی “اثبات شد آنچه که باید میشد” این کلمه در واقع از یک کلمه یونانی گرفته شده که اولین بار توسط خود داروین به انگلیسی برگردانده شد، منظور داروین از این عبارت در انتهای لیست این بود که “به اندازه کافی اثبات شد تا ازدواج کنم”. [1]

در زمان داروین، این لیست جنبه های مثبت و منفی، یک الگوریتم “مورد احترام و ریشه دار” بود که یک قرن پیش توسط بنجامین فرانکلین بوجود آمده بود. این الگوریتم که به تکنیک دو ستونی فرانکلین در تصمیمات دشوار معروفه از زبان فرانکلین این گونه شرح داده میشه :

_config.yml

راه من اینست، یک صفحه‌ از کاغذ را‌ با یک خط به دو ستون تقسیم میکنم: یک ستون به نام جنبه های مثبت و ستون دیگر به نام جنبه های منفی. سپس ظرف مدت سه یا چهار روز، در هر ستون شواهد مربوط به جنبه های مثبت و منفی را‌ در تحقق یادداشت می‌کنم. وقتی در طول این چند روز تمامی مواردی که به ذهنم رسید را‌ یاداشت کردم به بررسی اهمیت موارد یادداشت شده می‌پردازم. اگر در هر ستون مواردی وجود داشته باشد که از لحاظ اهمیت هم وزن باشند، هر دو خط می‌خورند. اگر یک جنبه مثبت معادل دو جنبه منفی باشد، آنوقت هر سه خط خواهند خورد. به همین ترتیب در نهایت مشخص میشود که تعادل به نفع کدوم تصمیم هست و به این شکل یقین حاصل می‌شود.

اما نتیجه این الگوریتم اینه که هرچند وزن جنبه های مثبت و منفی نمیتوانند با کیفیت جبری (از دیدگاه ریاضی) سنجیده شوند، اما فرانکلین اعتقاد داره، زمانی که آن‌ها به صورت مقایسه‌ای تحلیل میشوند، میتواند بهتر قضاوت کند و احتمال تصمیم‌گیری عجولانه کمتر میشود.فرانکلین میگوید: من از این نوع معادله بسیار سود بردم به طوریکه آن را‌ Moral Algebra نام گذاری میکنه. [2]

در تصویر زیر لیست دو ستونی دارا‌ین نمایش داده شده که مربوط به جولای 1838 هست.

_config.yml

وقتی در مورد “تفکر کردن” میاندیشیم، شاید به نظر ساده بیاد که هر چه بیشتر فکر کنیم بهتره، به عنوان مثال، شما میتونین تصمیم بهتری بگیرین وقتی لیست بلند‌تری از جنبه های مثبت و منفی داشته باشین، هر چه فاکتور های مناسب بیشتری شناسایی کنید، میتونین پیش بینی بهتری در بازار سهام داشته باشین و هر چه زمان بیشتری صرف نوشتن یک گزارش کنید مطلب بهتری از آب در میاد. مطمینا این همون چیزیه که الگوریتم فرانکلین پایه اساس بحث خودش قرار داده. از این دیدگاه، روش”جبری” داروین برای ازدواج علارغم غرابتش (یا شاید بی قاعدگیش) به صورت شگفت آوری و حتی بطور قابل ستایشی منطقی به نظر میرسه.

هر چند اگه فرانکلین یا داروین تا عصر یادگیری ماشینی دوام آورده بودن (علمِ آموختن تصمیم گیری صحیح از تجربیات پیشین به رایانه ها)، میدیدن که پایه های Moral Algebra شون داره میلررزه. این سوال که چقدر سخت (زیاد) بیندیشیم و چند تا فاکتور را‌ مد نظر قرار بدیم یک گره کور در یادگیری ماشینی و احتمالاته، که محققین این زمینه به اون “بیش برارزش” میگن. برای کنار اومدن با این مشکل یک تدبیر وجود داره که میگه کم تر فکر کنیم! اگه از این مفهوم آگاه باشیم روش ما برای تخمین مارکت و … تغییر میکنه.

هر تصمیمی (که به صورت روزمره میگیریم) در واقع یک نوع پیش بینیه به عنوان مثال چقدر به چیزی علاقه خواهید داشت قبل از اینکه حتی امتحانش کنید، یا اینکه روند بازار x چطور پیش خواهد رفت و غیره. هر پیش بینی، الزاما شامل فکر کردن در مورد دو موضوع متمایزِ “چیزهایی که میدونید و چیزهایی که نمیدونید” است. در واقع این دو موضوع تلاشیه برای تدوین کردن یک تئوری، تئوری که تجربیاتی را که تا به امروز آموخته اید را به حساب خواهد آورد و چیزهایی درباره آینده، آینده ای که شما حدس میزنید، خواهد گفت. یک تئوری خوب، البته هر دو را انجام خواهد داد، اما حقیقت اینه که در هر پیش بینی یک کشش غیر قابل اجتنابی وجود داره. برای روشن تر ساختن این کشش بیاین یک نگاه به داده هایی که ممکنه به داروین مربوط باشه داشته باشیم: رضایت زندگی افراد بر 10 سال اول ازدواج آنها، طبق یکی از تحقیقات اخیر که در آلمان انجام شد. [3]

هر نقطه در نمودار پایین، از این تحقیق گرفته شده و کار ما در اینجا ارایه یک فرمول برای خطی است که از میان این نقاط عبور میکند و در آینده نیز امتداد خواهد داشت، خطی که به ما این امکان را‌ میده که یک پیش‌بینی با توجه به داده های 10 سال پیش انجام بدیم. یک فرمول احتمالی میتونه فقط از یک فاکتور برای پیش بینی رضایت زندگی استفاده کنه: “زمانی که از ازدواج گذشته”. این فرمول یک خط راست را‌ بوجود میاره. یه احتمال دیگر میتونه استفاده کردن از دو فاکتور زمان ومربع زمان باشه، که در نتیجه باعث بوجود اومدن یک خط U شکل میشه که توسط اون میتونیم به صورت بالقوه، رابطه پیچیده تری بین زمان و خوشبختی پیدا کنیم. اگر ما همینطور این فرمول را‌ برای اضافه کردن فاکتور های بیشتر بسط بدیم، خطی که از این رابطه بدست میاد، منعطف‌پذیر تر خواهد شد و از نقاط بیشتری عبور خواهد کرد. وقتی تعداد فاکتور هایمان به 9 تا افزایش پیدا کنه فرمول ما میتونه روابط خیلی پیچیده ای را‌ ضبط کنه.

_config.yml

به زبان ریاضی، مدل دو-فاکتور ما تمامی اطلاعاتی که در مدل یک-فاکتور وجود داره، را‌ در بر میگره، همینطور مدل 9-فاکتور با یک اعمال نفوذ تمامی نقاطی که از نظر دو مدل اول دور مانده اند را‌ در بر میگیره. با این استدلال، به نظر میرسه که مدل 9-فاکتور بایستی همیشه بهترین پیش بینی را‌ ارایه بده، اما به این سادگی ها هم نیست! نتایج اعمال سه مدل بر روی داده ها در شکل زیر نمایش داده شده است:

_config.yml

مدل یک-فاکتور، به طرز شگفت آوری محل دقیق تعداد زیادی از نقاط را‌ از دست میده (به حساب نمیاره)، اما روند (امتداد) اصلی دادها را‌ ضبط میکنه. با این حال، این پیش بینی خطی به کاهش خود ادامه خواهد داد و در نهایت به بدبختی نامحدود ختم خواهد شد! یه چیزی در مورد این مسیر کاملا درست به نظر نمیرسه. مدل 2-فاکتور ما نسبت به مدل اول از شرایط بهتری برخورداره، با این مفهوم که بیشتر با اطلاعات نظرسنجی همسازه و شکل تقریبا منحنی اون پیش بینی بلند مدت متفاوتی را‌ نشون میده، با این مضمون که بعد از کاهش اولیه رضایت زندگی، روند این نزول شامل افت و خیز های بیشتری در طول زمان خواهد بود. در نهایت مدل 9-فاکتور از میان تمامی نقاط نظرسنجی عبور میکنه، اساسا این مدل، یک مدل درخور برای تمامی داده های این نظرسنجی هست، اما اگر به نتایج پیش بینی شده این مدل برای سالهایی که در تحقیق گنجانده نشده دقت کنید به موثر بودن این مدل پی خواهید برد!

چیزی که این مدل به ما میگه اینه: بعد از گذشت فقط چند ماه از ازدواج، سطح رضایت طرفین از یکدیگر به شدت افزایش پیدا میکنه و بعد از 10 سال کش و قوس به ناگهان رضایت به صفر میرسد. در مقابل، پیش بینی مدل 2-فاکتور سازگار تر با چیزهایی که روانشناسان و اقتصاددانان میگویند، است. (رو‌انشناسان و اقتصاددانان بر این باورند که سطح رضایت زوجین به حالت عادی بر میگرده یعنی سطح “خط مبنا” رضایت انسان از زندگی- سطح رضایت حقیقی”). درسی که از این ماجرا میشه گرفت اینه:

این گفته مطمینا درسته که، به حساب آوردن تعداد فاکتور های بیشتر در یک مدل، اون را‌ برای داده های موجود بیشتر شایسته میسازه، اما این “شایسته بودن” برای داده های کنونی الزاما به معنای یک پیش بینی بهتر نیست!

در شکل زیر به وضوح نشان داده شده که اضافه کردن مقدار ناچیزی نویز تصادفی به داده ها میتونه نتایج وحشتناکی در مدل 9-فاکتور بوجود بیاره، درحالی که دو مدل 1 و 2-فاکتور نسبت به مدل 9-فاکتور پایدار و سازگار تر هستند.

_config.yml

بدیهی‌ست، مدلی که بسیار ساده است به عنوان مثال، یک خط راست از یک فرمول یک فاکتوره نمیتونه الگوی اصلی موجود در داده ها را‌ به خوبی ضبط کنه. اگر “حقیقت داده ها” شبیه یک منحنی باشه، هیچ خط راستی نمیتونه اون را‌ یاد بگیره. از طرف دیگر،یک مدل که بسیار پیچیده است مثل مدل 9-فاکتور خودمون، نسبت به نقاط خاصی از دادها ها بیش از حد حساس میشود. به عنوان یک پیامد، چون این مدل به طور موشکافانه ای به داده های خاص دیتاست وفق داده شده، نتایج بسیار متغیری را تولید میکند. این چیزیست که آمار شناسان به اون بیش برارزش میگویند.

یکی از عمیق ترین حقایق یادگیری ماشین اینست که : همواره خوب نیست که از یک مدل “پیچیده تر” استفاده کرد، مدلی که فاکتور های بیشتری را به حساب می‌آورد. اما مسئله مهمتر اینست: چگونه پیچیدگی یک مدل را توجیه کنیم، و یا اینکه تا چه میزان پیچیدگی یک مدل قابل توجیه است؟

بیش برارزش یا “پرستش داده” ؟

اگر مجموعه عظیمی از داده ها را‌ داشته باشیم و این مجموعه داده بگونه ای جمع آوری شده باشند که تهی از هرگونه اشتباه احتمالی باشند، بگونه ای که دقیقا نمایانگر موضوعی که ما میخواهیم ارزیابی کنیم باشند استفاده از پیچیده ترین مدل موجود قطعا بهترین نتایج را بهمراه خواهد داشت. اما اگر بخواهیم مدلمان را به شکل عالی به دادهایمان برارزش (fit) کنیم زمانیکه که یکی از آن فاکتور ها نتواند همیشه ثابت باقی بماند آنگاه ما در دام بیش برارزش میافتیم.

به عبارت دیگر، بیش برارزش زمانی ظهور پیدا میکند که ما با نویز یا اندازه گیری های اشتباه سروکار داریم (چیزی که همیشه اتفاق می‌افتد!). میتونه خطاهایی در جمع آوری داده ها وجود داشته باشه، یا اینکه چگونه گزارش شده اند. گاهی اوقات، موضوع مورد اکتشاف ما به عنوان مثال خوشبختی، حتی به سختی تعریف میشوند، یا تعریف جامعی در مورد آنها وجود ندارد، چه برسد به اندازه گیری آنها!

در طول تاریخ، متون مذهبی پیرا‌انشان را در مقابل بت پرستی هشدار داده اند: پرستش مجسمه ها، نقاشی ها، بقایای فیزیکی قدیس ها و سایر محصولات مصنوعی قابل لمس. به عنوان مثال تصویر زیر جزء اولین فرمانهای عهد عتیقه که کوتاه شده یکی از ده فرمان طبق کتاب سفر تثنبه است که مضمونی با این عنوان داره: صورتی تراشیده و هیچ تمثالی از آنچه بالا درآسمان است، و از آنچه پایین در زمین است، و ازآنچه در آب زیر زمین است، برای خود مساز. نزد آنها سجده مکن، و آنها را عبادت منما … [4]

_config.yml

در کتاب پادشاهان آورده شده، که موسی به دستور خدا یک مار از جنس برنز ساخت و آن را بر رو‌ی چوبی سوار کرد. هر کس که توسط این مار گزیده شده بود با نگاه کردن به اون دوباره شفا یافت. بعد از این جریان، تندیس مار به عنوان بت به پرستش در آمد (به جای خود خدا) [5]

به قول مولوی که میگه: مادر بت ها بت نفس شماست زانکه آن بت مار و این بت اژدهاست

اساسا بیش برارزش نوعی “بت پرستی داده” است، با پیامد تمرکز بر روی آنچه که قادر به اندازه گیری هستیم نه آنچه که اهمیت دارد.

این شکاف بین داده ها و پیش بینی مورد انتظار ما، کمابیش در همه جا وجود دارد. هنگامی که یک تصمیم بزرگ میگیریم، فقط میتونیم راجع به چیزی که بعدا خوشحالمان میکند با فکر کردن در مورد فاکتور هایی که اکنون برایمان مهم هستند اظهار نظر کنیم. به قول دنیل گیلبرت استاد را‌انشناسی دانشگاه هاروارد: آینده ما اغلب “پول خوبی برای پاک کردن خالکوبی هایی که قبلا ما برای گرفتن اونها پول خوبی پرداخته‌ایم ، میپردازد” . [6]

هنگامی که میخواهیم یک پیش بینی مالی را‌ انجام بدیم، ما فقط میتونیم به آنچه که به قیمت سهام در گذشته وابسته بوده نگاه کنیم نه چیزی که در آینده ممکنه وابسته باشه. حتی در فعالیت های کوچک روزمره مان این الگو وجود دارد. داده های پیرامون ما سرشار از نویز هستند، در نتیجه اگر فاکتور های بیشتری در مسئله مورد مناقشه دخیل کنیم میتونه ما را‌ به سمت خطای بهینه سازی برای چیز اشتباهی سوق بده (یعنی یادگرفتن نویز موجود در داده ها توسط مدل نه الگوی حقیقی داده ها).

در نظر گرفتن فاکتور های بیشتر و بیشتر، و تلاش گستره تر برای مدل کردن آنها میتونه ما را‌ به سمت خطای بهینه سازی برای مسئله اشتباه سوق بده، “سوق دادن نیایشگران به “مار برنزِ داده” به جای قدرت عظیم که در پرتو آن قرار گرفته است.(استعاری از داستان عصای موسی)”

بیش برارزش در همه جا

بیش برارزش در واقع در همه جا یافت میشود، به عنوان مثال “حس چشایی” را‌ در نظر بگیریم. چطور ممکنه غذاهایی که بهترین مزه را‌ برای ما دارند به طور گسترده ای برای سلامت ما مضر باشند مادامیکه وظیفه اصلی حس چشایی ما از دیدگاه تکاملی بازداشتن ما از خوردن چیزهای بد هست؟

طعم و مزه یک شاخص اندازه گیری سلامت در بدن است. چربی، قند و نمک مواد مغذی مهمی هستند و برای چند صد هزار سال، خوردن غذاهای حاوی آنها یک معیار مناسب برای یک رژیم غذایی پایدار بوده است. اما داشتن توانایی اصلاح غذاهای موجود، میتونه این رابطه را‌ در هم بشکنه. با این تفاسیر می تونیم چربی و قند را‌ به صورتی به مواد غذایی اضافه کرد که فراتر از مقادیری باشه که برای بدن ما مفید است، و سپس این غذاها را‌ به صورت انحصاری به جای غذاهایی که از ترکیب گیاهان، گوشت و … (غذاهایی که از لحاظ تاریخی رزیم غذایی انسان را‌ تشکیل میداده ) درست میشن را‌ مصرف کرد. به عبارتی میتونیم طعم و مزه را‌ به یک فرد تحمیل کنیم. (یا حس چشایی اون شخص را‌ بیش برارزش کنیم). هرچه ماهرانه تر غذاهای موجود را‌ اصلاح کنیم (و هرچه سبک زندگیمان از اجدادمان فاصله بگیرد)، شاخص طعم و مزه ناقص تر خواهد شد. این فاکتور اندازه گیری در بدن یعنی حس چشایی آفت جان انسان شده و ما را‌ به شکل خطرناکی قادر میسازه که دقیقا همون چیزی که ما میخواهیم را‌ داشته باشیم حتی اگه اون چیز بد باشه (یا اون دقیقا چیز درست نباشه).

وقتی به باشگاه میروید تا اون اضافه وزنی که در نتیجه خوردن مواد قندی بدست آوردید را‌ آب کنید ، ممکنه در دام بیش برارزش تناسب اندام گیر کنید. برخی از علائم تناسب اندام به عنوان مثال، پایین بودن چربی و بالابودن حجم توده عضلانی بدن را‌ میشه به سادگی اندازه گیری کرد و این علایم، به پایین بودن خطر بیماری های قبلی و سایر بیماری ها مربوط هستند. اما این موارد میتوانند شاخص اندازه گیری ناقص باشند. بیش برارزش کردن این علائم یعنی اتخاذ کردن یک رزیم غذایی افراطی برای پایین آوردن چربی بدن و خوردن هورمون های استرا‌ییدی برای پرو‌رش عضلات شاید بتونه تصویری از سلامت خوب را‌ در ذهن تداعی کنه، اما این فقط یک تصویره.

بیش برارزش همچنین میتونه در ورزش رخ بده، به عنوان مثال، سامان از زمان نوجوانی یک شمشیرباز بوده. هدف اصلی شمشیر بازی در گذشته آموزش دادن چگونگی دفاع‌ازخود به افراد در یک مبارزه تن‌بتن بود و شمشیر هایی که امرو‌زه در مسابقات استفاده میشود شبیه به شمشیر های قدیمی هستند که برای اینجور رخ دادهایی استفاده میشد. ( مخصوصا در مسابقات اسلحه اپه که امرا‌ز شاهدش هستیم).در ویدئوی زیر نمونه‌ای از شمشیر بازی در سال 1967 در فرانسه نمایش داده شده:

اما از سال 1988 استفاده از ابزار های الکترونیک در مسابقات مرسوم شد و به این ترتیب ، قوانین جدید در سراسر دنیا به اجرا در آمد .با معرفی ابزارهای الکترو‌نیکی ثبت امتیاز (در نوک تیغه دگمه ای وجود داره که در صورت وارد شدن ضربه ای با نیرو‌ی مناسب به بدن حریف ، ضربه را رو‌ی دستگاه مخصوص ثبت می کند) ذات این ورزش هم تغییر کرد و مهارت های بدردنخوری که در یک مبارزه تن‌بتن اصلا به کار شما نمیاد به شکل مهارت‌های حیاتی درآمدند. شمشیرهای امرا‌زی از یک تیغه انعطاف پذیر استفاده میکنند که به مبارزان این امکان را میدهد که با وارد کردن ضربه آهسته و فشردن این دگمه بر بدن حریف امتیاز کسب کنند. در نتیجه چیزی که امرو‌ز در این ورزش شاهدش هستیم بیشتر شبیه کتک کاری با یک لایه فلزی نازک است نه ضربه‌های مهیب و بریدن! این ورزش امرو‌زه طرفداران بسیاری دارد و نسبت به گذشته مهیج تر شده، اما هنگامی که یک ورزشکار تاکتیک هایش را‌ به گرفتن امتیازات بیشتر یا امتیاز ندادن بیش برارزش میکند، در شمشیر بازی دنیایی واقعی این مهارت ها را غیر سودمند خواهد یافت. [7]

شاید هیچ جا بیش برارزش به قدرتمندی و مشکل سازیِ دنیای کسب و کار نباشد، جایی که قوانینی به عنوان “ساختار های تشویقی کار” وجود دارد. استیو جابز میگه:

خیلی مراقب باشید که افراد را‌ به انجام دادن چه چیزی تشویق میکنید، زیرا انواع مختلف ساختارهای تشویقی میتواند پیامد‌هایی را‌ به همراه داشته باشد که شما نمیتوانید آنها را پیش بینی کنید. [8]

سم آلتمن مدیر استارت آپ وای کامبینیتر نکته ای که استیو جایز گفت را مجددا گوشزد میکنه:

واقعا این موضوع حقیقت دارد که شرکت چیزی را میسازد که موسس آن تصمیم به سنجش آن دارد. [9]

یکی از کلاس های استنفورد که برای من جالب بود کلاس CS183B بود که در سال 2014 توسط سم آلتن در این دانشگاه برگزار شد. این کلاس به چگونگی ایجاد یک استارت آپ میپردازد. سم آلتمن قبلا دانشجوی این دانشگاه بود اما بعدها دانشگاه را‌ برای ساختن شرکت خودش ترک کرد. ویدیو لکچر اول:

در حقیقت، خیلی سخته که بتوان معیار های سنجش و انگیزشی را بوجود بیاوریم که عواقب انحراف کننده ای نداشته باشد. به عنوان مثال کارخانه ای با تمرکز بر روی شاخص تولید، ناظران را‌ به این سمت پیش میبره که از نگهداری و تعمیر دستگاه ها غفلت کنند و باعث بوجود آمدن فجایع در آینده نزدیک شوند.

از نمونه دیگر اینگونه شاخص ها میتوان به تبلیغات اینترنتی اشاره کرد. آویناش کوشیک مسئول بازاریابی دیجیتال گوگل هشدار میدهد که تلاش برای جلب نظر کاربران سایت به دیدن تبلیغات بیشتر مساویست با پرکردن وب سایت با تبلیغات متنوع . وقتی به شما بر مبنای هزینه به ازای نمایش پول پرداخت میشود مشوق اصلی شما برای کسب در آمد بیشتر “به نمایش گذاشتن تبلیغات بیشتر در صفحات و مطمین شدن از اینکه کاربران بیشتری این تبلیغات را می بینند”، است. این انگیزه تمرکز از یک موجودیت مهم به نام مشتری (کاربر) دور کرده و آن را به سمت تبلیغ کننده میبرد. شما ممکنه در کوتاه-مدت پول بیشتری بدست بیارید اما نمایش تبلیغات زیاد و مقالات انباشه شده با تبلیغات و عناوین غلوآمیز کاربران وبسایت شما را در بلند-مدت فراری میدهد. [10]

_config.yml

در برخی از موارد تفاوت بین یک مدل و دنیای واقعی به راستی مسئله بین مرگ و زندگیست. در ارتش و نیروی انتظامی، به عنوان مثال، تکرار و به‌یادسپاری یک شیوه کلیدی برای القای مهارت های خط‌آتش به شلیک کنندگان است. هدف این است که حرکات و تاکتیک‌های مشخص را تا حدی به اونها آموزش بدهند که این پرو‌سه به صورت کاملا خودکار برای آنها تبدیل شود. اما هنگامی که همین مامورین در دام بیش‌برارزش گیر بیفتند میتواند فاجعه ساز شود.

داستانهایی وجود دارد از افسران پلیس که به عنوان مثال بعد از شلیک زمانی را‌ صرف برداشتن فشنگ های خالی از روی زمین کردند و آن را در جیب خود گذاشتند بدون آنکه متوجه اینکار باشند، این کار یکی از آداب خوبی است در سالن های تیراندازی فرا می‌گیرند. [11]

ديو گرا‌سمن سرهنگ دوم سابق ارتش آمريكا و استاد را‌انشناسي آکادمی نظامی ایالات متحده معرو‌ف به وست پوينت مینویسه: “در بسیاری از تیراندازی های واقعی بعد از اینکه کش مکش پایان میابد، مامورین از اینکه فشنگ های خالی را در جیبشان دیدند بدون داشتن هیچ ذهنینی از اینکه چگونه اونجا قرار گرفته اند، بسیار شگفت زده شدند. در موارد بسیاری، مامورین مرده با فشنگ‌های خالی در دستشان پیدا شد، که به همین علت در وسط رو‌یه اجرایی تیر خورده بودند” [12]

حتی در FBI مواردی وجود داشته که مامورین بعد از اینکه دو شلیک همزمان به هدف انجام میدادن تفنگ خودشون را‌ غلاف میکردند بدون توجه به اینکه آیا به هدف شلیک کردند یا خطری اونها را‌ تهدید میکنه. مامورین این روش تیراندازی را‌ در آموزش‌های نظامی فرا گرفته بودند. خطاهایی از این دست در مراکز نظامی به training scars معروف هستند. training scars به عادت های بدی اشاره داره که مامورین در حین آموزش فرا می گیرند. تمام این موارد منعکس کننده این واقعیت است که شخص میتواند به آماده سازی خودش نیز بیش برارزش شود! حتی در یک مورد تلخ، بعد از اینکه یک مامور اسلحه را از دست مهاجم گرفت، آن را به طور غریزی به مهاجم پس داد، این کار منجر به مرگ او شد، تمرینی که مکررا با مربی خود انجام داده بود. [13]

تشخیص دادن بیش‌برارزش: اعتبار سنجی متقاطع

چونکه بیش‌برارزش، نخست خودش را به عنوان یک تئوری نشان میدهد که به شکل خیلی خوبی داده‌های موجود را بیش‌برارزش میکند، ممکنه به نظر سخت بیاد که بتوان تشخصش داد. چگونه میتوان تفاوت بین یک مدل خوب و مدلی که در دام بیش‌برارش گیر کرده را فهیمد؟ در یک محیط آموزشی چگونه میتوان بین یک کلاس از دانش‌آموزان که در موضوع اصلی(مورد اهمیت)، سرآمد هستند و کلاسی که دانش آموزان برای آماده شدن برای امتحان آموزش داده میشوند [14]، تمایز قائل شد؟(همانند تفاوت بین دو مفهوم موضوعیت و طریقت)

در دنیای کسب و کار، چگونه میتوان بین یک فرد متخصص و یک کارمند که به طرز زیرکانه‌ای کارش را به سمت شاخص‌های عملکرد کلیدی شرکت یا برداشت رئیسش از وی برارزش میکند، تمایز قائل شد؟ در هم شکستن این سناریوها مطمئنا چالش برانگیز است، اما غیر‌ممکن نیست.

یادگیری ماشینی چندین استراتژی غیرانتزاعی برای تشخیص بیش‌برارزش ارائه داده و یکی از مهمترین آنها مفهومی است به نام اعتبارسنجی‌متقاطع.

به بیان ساده، اعتبارسنجی‌متقاطع یعنی ارزیابیِ نه تنها چقدر خوب مدل دادهایی را که به آن داده میشود را برارزش می‌کند، بلکه تا چه میزان به داده هایی که ندیده، عمومیت می‌بخشد. در مثال ازدواج، ما ممکنه دو نمونه آموزشی را به صورت تصادفی کنار بگذاریم و مدلمان را به 8 نمونه آموزشی باقیمانده برارزش کنیم، سپس از دو نمونه کنارگذاشته شده به عنوان نمونه های آزمایش استفاده کنیم تا دریابیم مدل ما تا چه میزان قابل تعمیم به داده های مستقل از داده های آموزش است. دو نمونه‌ی آزمایش در واقع همانند قناری در معدن سنگ عمل میکند(در گذشته از قناری در معادن ذغال سنگ به عنوان آژیر خطر استفاده میشد، چنانچه گاز دی‌اکسید‌کربن یا متان در معدن نشت میکرد، قناری زودتر از معدن‌کاران میمرد.) [15]: چنانچه مدل به خوبی از میان 8 نمونه آموزشی عبور کند اما دو نمونه آزمایش را از دست بدهد شرط خوبیست که دستِ بیش‌بر‌ارزش در کار است.

جدای از کنارگذاشتن برخی از نمونه‌های آموزشیِ دردسترس (به عنوان مجموعه اعتبارسنجی)، شاید استراتژی بهتر، استفاده از داده‌هایی باشد که به شکل دیگری برای ارزیابی جمع آوری شده اند، همانطور که دیدید معیار اندازه گیری “مزه” همیشه نمیتواند عامل بازدارنده مناسبی برای خوردن غذای نامناسب باشد و ما در دام بیش‌برارزش گیر افتادیم.

در مدارس، به عنوان مثال آزمون های استاندارد شده (آزمون استاندارد شده آزمونیست که اغلب توسط مدارس در سطح انبوه برای اندازه‌گیری پیشرفت تحصیلی دانش‌آموزان و یا مقاصد ارزشیابی دوره‌های تحصیلی تهیه و توزیع می‌شوند) که مزایایی مثل داشتن صرفه مقیاس متمایز ([صرفه مقیاس] در علم اقتصاد به معنی فرآوری زیاد که با ازدیاد فروش و کم شدن قیمت همراه است)، امکان تصحیح(نمره دهی) سریع و ارزان‌قیمت، دارند. در کنار اینگونه آزمون‌ها، از طرف دیگر مدارس میتوانند به صورت تصادفی تعداد کمی از دانش آموزان به عنوان مثال یک نفر از هر کلاس یا از هر صد دانش آموز یک نفر توسط یک متد ارزیابی متفاوت سنجیده شوند مثل آزمون شفاهی.

آزمون های استاندارد شده فیدبک آنی میدهند، شما می توانید هر هفته یک آزمون کوچک کامپیوتری از دانش آموزان بگیرید و پیشرفت کلاس را به صورت بلادرنگ به صورت نمودار در بیاورید، در حالی که آزمون فرعی (به عنوان مثال آزمون شفاعی) در حکم اعتبار سنجی متقاطع عمل کنید، این کار با هدف اطمینان از اینکه دانش آموزان در واقع چیزی به دانش‌شان اضافه میشود، انجام می‌گیرد نه صرفا بهتر شدن در آزمون دادن! اگر نتایج آزمون استاندارد شده افزایش پیدا کند در حالی که نتایج “آزمون غیر استاندارد” در جهت مخالف حرکت کند، این یک نشانه هشدار برای مدیران و معلمین خواهد بود که شرایط “آماده شدن برای امتحان” (شرایطی که دانش‌آموزان فقط برای موفق شدن در امتحانات درس میخوانند و از هدف اصلی آموختن دور میشوند) رخ داده، و مهارت های دانش آموزان شروع به بیش‌برارزش کردن به فوت‌وفن خود آزمون شده است.

اعتبار‌سنجی‌متقاطع همچنین یک پیشنهاد برای مامورین پلیس دارد که آنها را از یادگرفتن عادت های بد در پرو‌سه آموزش باز میدارد. همانطور که آزمون شفاهی میتواند به عنوان یک اعتبارسنجی‌متقاطع برای آزمون استاندارد شده عمل کند، ارزیابی گاه‌وبیگاه “آموزش متقاطع” میتواند معیار خوبی برای سنجش این موضوع باشد که آیا زمان عکس‌العمل و دقت تیراندازی قابل تعمیم به کارهای غیرمعمول است یا خیر؟ اگر اینطور نباشد میتوان نتیجه گرفت که زمان تغییر در پراوسه آموزش فرا رسیده است. هرچند هیچ چیز شاید نتواند به واقع یک مامور پلیس را برای یک درگیری واقعی آماده کند، اما تمریناتی مثل این می‌تواند حداقل نشانگر این موضوع باشد که training scars میتواند در کدام قسمت از ماموریت شکل بگیرد.

چگونه با بیش‌برارزش مبارزه کنیم: جریمه پیچیدگی

_config.yml

“اگر نتوانید چیزی را به سادگی توضیح دهید، پس آن را خیلی خوب نفهمیده‌اید” این نقل قول عموما به آلبرت انیشتین منصوب داده میشه، هرچند این انتصاب به احتمال قوی جعلی‌ است. در برخی از کتاب ها این نقل قول به صورت ناشناس آورده شده!

تا کنون برخی از روشهایی که می‌توان از آنها برای تشخیص و اندازه گیری بیش‌برارزش استفاده کرد شرح داده شد، اما چگونه میتوان این اثر را کم کرد؟ از یک دیدگاه آماری، بیش برارزش یک نشانه از بیش‌از‌حد حساس شدن مدل به داده های آموزش است.

یک راه برای انتخاب بهترین مدل، استفاده قاعده تیغ اوکام است، این قاعده میگوید: از میان دو نظریه که توان توصیف و پیش‌بینی یکسانی دارند، نظریه‌ ساده تر را برگزینید. منظور از ساده‌تر نظریه‌ای است که است که کم‌ترین انگاشت‌ها در آن به کار رفته باشد (به عبارت ساده اگر شما دو نظریه احتمالی دارید که همه شواهد موجود را در بر دارد، بهترین نظریه آن است که دارای اجزای متحرک کمتر است.) “همه شواهد موجود را در بردارد” جز مهم این قاعده است!

کلمه “ساده‌تر” در اینجا معنای خاص دارد، “نظریه ساده‌تر” الزاما به معنی نظریه‌ای که میشود به روش ساده‌تری توصیف کرد نیست، بلکه به این معنای نظریه‌ای است که اجزاء محرک کمتری دارد (تعداد متغیر کمتر در یک معادله، انواع ایده های انتزاعی کمتر، یا فرض و گمان کمتر).

_config.yml

این قاعده همچنین به معنای “اصل‌ امساک” نامگذاری شده است. معنای لغوی امساک بخل یا خست است، بخیل به فردی اشاره داد که هنگام خرج کردن خیلی احتیاط به خرج میدهد. فرض کنید اگر شما میبایستی برای هر بخش از نظریه‌ای که در حال ایجاد آن هستید، متغیرها یا فرضیه ها 250 هزار تومان پرداخت میکردید، شما مطمئنا تمام سعی خود را میکردید که فقط بابت اجزایی پول پرداخت کنید که وجود آنها ضروریست نه همه اجزا، در این شرایط قاعده تیغ اوکام برای جیب شما بسیار مهم خواهد بود. بیاد داشته باشید که قاعده تیغ اوکام، یک قاعده سرانگشتی است نه یک قانون. در بسیاری از مواد بسیار عالی عمل می‌کند، و دانشمندان و فلاسفه در طراحی آزمون‌ها و استدلال‌ها به آن تکیه می‌کنند، اما شما نباید آن را‌ به عنوان قانون محکم منطقی بپذیرید! یکی از مثال های معروف این قاعده معادله مشهور انیشتن E=MC2 است. البته مراقب باشید شرط آن یعنی “ همه شواهد موجود را در بردارد” رعایت شود در غیر اینصورت در دام سادگی گرفتار می‌شوید. [16]

_config.yml

تا کنون گفتیم اگر همه چيز را يکسان کنيد، اونوقت ساده ترين توضيح، درست ترين است، اما شرایط همیشه کاملا برابر نیست، پس همیشه نمیتوان به صراحت از این قاعده در ریاضیات استفاده کرد. در جدال با این چالش، در دهه 60 میلادی آندری نیکولایویچ تیخونوف راه‌حلی را پیشنهاد داد: یک عبارت به محاسبه‌تان اضافه کنید تا پیچیدگی را جریمه کند. با معرفی این عبارت (پیش‌قدر استقراء) نه تنها مدل پیچیده‌تر بدتر عمل نمی‌کند، بلکه به شکلی بهتر میتواند داده‌ها را با توجیه پیچیدگی خودش، تشریح کند. دانشمندان علوم کامپیوتر به این قاعده تنظیم (رگولاریزاسیون) می‌گویند.

یک الگوریتم در سال 1996 توسط رابرت تیبشیرانی کشف شد که به LASSO معرو‌ف است. لاسو یک مدل تنظیم شده از مدل کمترین مربعات است. در لاسو با افزایش جریمه، تعداد بسیار بیشتری از ضرایب به سمت صفر میل می‌کنند و فقط فاکتور هایی که تاثیر بیشتری بر‌روی نتایج دارند در معادله باقی می‌مانند، مدل بیش‌برارزش شده 9-فاکتور قبلی را در نظر بگیرید، با جریمه کردن پیچیدگی این معادله به یک معادله ساده و محکم‌تر با چند فاکتور ضروری تبدیل می‌شود.(لاسو در حقیقت یک اسم “تخیلی” برای نرم L1 است) [17]

تکنیک هایی مثل لاسو در حال حاضر در اکثر مدلهای یادگیری ماشین یافت می‌شود، اما قواعد مشابه “جریمه پیچیدگی” همچنین در طبیعت به چشم میخورد. موجودات زنده و ارگانهایشان همیشه به صورت خودکار به سمت سادگی(غیر پیچیدگی) رانده میشوند.(به لطف محدودیت زمان، حافظه، انرژی و …)

به عنوان مثال، بار سوخت و ساز در بدن به عنوان یک “ترمز” برای پیچیدگی در ارگانها عمل می کند و کالری ازدست داده شده، حکم همان ضریب پیچیدگی را دارد(همان نرم L1 خودمان در یادگیری ماشین). این واقعیت که مغز انسان حدود یک پنجم کالری مصرفی روزانه انسان را می سوزاند، نشان دهنده ی مزایای تکاملی است که توانایی های ذهنی به ما ارائه می دهد، این میزان انرژی در حقیقت همان جریمه پیچیدگیست که مغز باید بپردازد. از سوی دیگر، از دیدگاه تکاملی داشتن مغزی با پیچیدگی به مراتب بالاتر هیچ کمکی در بالارفتن راندان نمی کند. [18]

در علوم رایانه، مدل‌های مبتنی بر مغز(یا حداقل یک دیدکارتونی ما نسبت به آن)، معروف به شبکه های عصبی می‌توانند توابع پیچیده دلخواهی را یاد بگیرند، این شبکه‌ها نسبت به مدل 9-فاکتور ما که قبلا درباره آن بحث کردیم بسیار انعطاف‌پذیر‌تر هستند، اما به دلیل همین انعطاف‌پذیری زیاد، آسیب‌پذیر هستند و میتوانند در دام بیش‌بر‌ارزش گرفتار شوند. شبکه‌های عصبی واقعی بیولوژیکی در مغز برخی از این مشکلات را با روشهای مختلف دور میزنند. متخصصین علوم اعصاب میگویند: مغز سعی میکند که تعداد نورا‌ن های فعال شده در هر لحظه کاهش دهد، این امر تاثیری مشابه قاعده لاسو دارد، یعنی فشار برای پایین آوردن پیچیدگی. همچنین، با استفاده از این‌چنین استراتژی‌هایی که در مغز وجود دارد (استراتژی که به کدینگ اسپارس معروف است، یکی از انواع کدگذاری عصبی است که برحسب موضع و محل قرار گیری نورون ها در برابر کدگذاری متراکم در نظر گرفته می شود. در این استراتژی، در هر لحظه،‌ تعدادی کمی از نورون‌ها شدیدا فعال و در حال فعالیت هستند، و بقیه خاموشند) محققین علوم رایانه شبکه های عصبی بوجود آوردند که خصوصیاتی شبیه کرتکس بینایی انسان دارند. [19]

زبان نمونه دیگری از یک نوع Lasso طبیعی است، هنگام سخن رانی و ارایه، پیچیدگی که توسط صحبت های طولانی مدت بوجود می‌آید با پر اتهاب شدن محدوده توجه شنوندگان، جریمه میشود. به این دلیل است که ایده‌های کسب و کار در قالب سخن‌رانی های آسانسوری بیان میشوند (سخنرانی آسانسوری استعاره ای از یک ارتباط بسیار موثر در یک زمان کوتاه است، به این دلیل واژه آسانسور به کار برده شده که وقتی شما وارد یک آسانسور میشوید فقط 60 ثانیه وقت دارید تا ایده‌تان را به کسی معرفی کنید.)

_config.yml

پندهای زندگی فقط زمانی تبدیل به ضرب‌المثل‌های خردمندانه میشوند که به صورت خلاصه و جذاب درآیند،زیرا گفته‌ها باید از درگاه شنوایی انسان که پیچیدگی نمیپذیرد،عبور کند.

اقتصاددان هری مارکوویتز جایزه نوبل سال 1990 در اقتصاد را برای نظریه سبد سهام مدرن(بهینه سازی پورتفولیو ) یا تحلیل میانگین واریانس برد. این نظریه در واقع چارچوب ریاضیاتی برای جمع‌آوری سبدی از دارایی‌ها است به نحوی است که بازگشت مورد انتظار برای یک سطح ریسک داده شده که تحت عنوان واریانس تعریف می‌شود، حداکثر شود. [20]

وقتی به سراغ سرمایه‌گذاری پس‌انداز بازنشستگی می‌رویم به نظر میرسه مارکویتز بهترین استراتژی را برای خودش به کار برده است. اما ایشان دقیقا چه‌کاری انجام داد؟ مارکویتز میگه: من بایستی کوواریانس گذشته گرو‌ه دارایی و مرز کارا رسم شده آنها را محاسبه میکردم، در عوض، اندوهی را تصورم کردم: اگر بازار سهام رشد داشته باشد و من در آن نباشم، یا اگر بازار سهام پایین برو‌د و من در آن حضور داشته باشم، هدف من کمینه کردن افسوس در آینده شد، در نتیجه مشارکتم را به صورت 50-50 بین اوراق قرضه و سهام تقسیم کردم. [21]

اما او چرا این کار را انجام داد؟ داستان برنده نوبل و استراتژی سرمایه‌گذاریش میتوانید نمونه ای از غیرمنطقی بودن انسانها باشد. (وقتی با پیچیدگی دنیای واقعی رو‌برو شد، مدل منطقی را رها کرد و یک مدل فرا ابتکاری ساده را دنبال کرد.) دقیقا به دلیل همین پیچیدگی دنیای واقعی است که مدل های ساده فرا ابتکاری در حقیقت ممکن است راه حل منطقی شوند. وقتی بحث مدیریت پورتفولیو(سبد سهام) به میان میاد، به نظر میرسه علارغم اینکه شما به اطلاعاتی که درباره بازار دارید بسیار مطمئن هستنید، در واقع بهتره همه اطلاعات را‌ بیخیال شید.

به‌کار‌بردن نظریه مدرن پرتفولیو مارکویتز مستلزم داشتن تخمین خوبی از خصوصیات آماری سرمایه گذاری های متفاوت است. یک خطا در این تخمین ها میتواند نتایج خیلی متفاوتی در تخصیص دارایی‌ها داشته باشد، که به صورت بالقوه‌ای ریسک را افزایش میدهد، در مقابل، تقسیم کردن پولتان به صورت یکنواخت بین اوراق بهادار و سهام تحت تاثیر داده هایی که شما مشاهده کرده اید، نیست. این استراتژی حتی سعی در برارزش‌کردن خودش به عملکرد گذشته انواع سرمایه گذاری ها ندارد، در نتیجه هیچ راهی برای بیش‌بر‌ارزش شدن وجود ندارد.

با الهام از مثال هایی مثل استراتژی پس‌انداز بازنشستگیِ مارکویتز، دو روانشناس گرد گینگرز و هنری برایتون استدلال کردند: میانبرهای تصمیم گیری که مردم در دنیای واقعی در بسیاری موارد به کار می‌گیرند، از این موضوع پیرو‌ی می‌کنند، برخلاف دیدگاه عمومی که پردازش کمتر، دقت را پایین می‌آورد این دو محقق در مقاله خود مینویسند: “مطالعه اکتشافی نشان میدهد که اطلاعات، محاسبات، و زمان کمتر در واقع میتواند دقت را افزایش دهد.” یک روش اکتشافی با فاکتور‌ها و محاسبات کمتر، دقیقا اثرات less-is-more را دارد. Less-is-more به معنی “کمتر غنی‌تر است”، اصطلاحی که برای اولین بار توسط رابرت براونینگ استفاده شد. مطالب زیادی در این باره وجود دارد که میشود درباره آن بحث کرد اما از حوصله این بحث ما خارج است. [22]

بازار شیر سویا در ایالات متحده، از اواسط دهه 1990 تا سال 2013، بیش از چهار برابر الان بوده است. اما بر اساس سر تیترهای خبری، به نظر می‌رسد از سال 2013 به بعد، این روند تغییر یافت و شیر بادام جایگزین آن شد. همانطور که لری فینکل، پژوهشگر مواد خوراکی و آشامیدنی به بلومبرگ بیزینسویک گفته: «در حال حاضر آجیل مرسوم است و سویا بیشتر شبیه غذاهای سالم از مد افتاده به نظر میرسد.» [23]

شرکت سیلک که مشهور به عامه پسند ساختن شیر سویا است (همانطور که از نامش پیداست)، در اواخر سال 2013 گزارش داد که محصولات شیر بادامش تنها در سه ماهه اول تا بیش از 50 درصد رشد داشته اند. در همین احوال، در یکی دیگر از اخبار مربوط به مواد آشامیدنی، برند پیشتاز آب نارگیل، ویتا کوکو، در سال 2014 گزارش داد که از سال 2011 فروشش دو برابر شده و از سال 2004 تاکنون به طرز شگفت‌انگیزی سیصد برابر شده است. نیویورک تایمز نیز نوشت: «به نظر می رسد آب نارگیل، از حوزه ناشناخته به اجتناب ناپذیر پریده است.» [24]

در همین حین، بازار کلم‌پیچ تنها در سال 2013 تا %40 رشد پیدا کرد. در سال قبل از آن، بزرگترین خریدار کلمپیچ پیزا هات بود که از آن به عنوان تزئینات، در سالنهای مربوط به سالاد خود استفاده میکرد. [25]

به طرز عجیبی به نظر میرسد برخی از اساسیترین حوزههای زندگی بشری، مانند این سوال که چه موادی باید در بدن خود وارد کنیم، بیشتر تحت تأثیر مدهای زودگذر باشند. بخشی از آنچه که باعث میشود طوفان این مدها دنیا را فرا بگیرد مربوط به سرعت تغییر فرهنگ ما است. در حال حاضر، اطلاعات سریعتر از همیشه در سراسر جامعه در جریان است، و در همین حین زنجیره های عرضه جهانی، می توانند باعث شوند تا مصرف کنندگان عادات خرید خود را به کلی تغییر دهند (بازاریابی، آنها را برای این کار تشویق می کند). چنانچه مطالعه ویژهای انجام شود که مزیت سلامتیِ فرضا بادیان را‌می را پیشنهاد دهد، میتواند ظرف یک هفته در تمام شبکه‌های اجتماعی و هفته بعد در تلویزیون و از قرار معلوم ظرف شش ماه در هر سوپر مارکتی دیده شود، و به زودی کتابهای آشپزی اختصاص یافته به بادیان را‌می تمام نشریات را پر میکنند. سرعت هیجانانگیز هم نعمت و هم بلا است.

در مقابل اگر ما به مسیری بنگریم که موجودات زنده به تکامل میرسند، متوجه مسأله جذابی می‌شویم: تغییر به آهستگی رخ میدهد، این بدان معناست که ویژگیهای موجودات امرو‌زی نه تنها توسط محیط زیست کنونی آنها، بلکه توسط پیشینه آنها شکل گرفته است.

برای مثال، طرح ضربدری عجیب سیستم عصبی ما (سمت چپ بدن ما توسط سمت راست مغز کنترل میشود و برعکس)، پیشینه تکاملی مهرهداران را بازتاب میکند. این پدیده که تقاطع ضربدری نامیده میشود (تقاطع اعصاب در مغز و نخاع شوکی )، در مسیر تکاملی از نقطهای برمیخیرد که بدن مهرهداران اولیه 180 درجه نسبت به سرشان چرخید؛ در حالیکه طناب عصبی بیمهرگان مانند خرچنگهای دریایی و کرمهای خاکی در سمت شکم آنهاست؛ در عوض طناب عصبی مهرهداران درامتداد ستون فقرات آنهاست.[26]

گوش انسان مثال دیگری را بیان میکند. از یک منظر کاربردی، گوش، سیستمی برای ترجمه امواج صوتی به پیامهای الکتریکی توسط تقویت آن امواج از طریق سه استخوان چکشی، سندانی و رکابی است. این سیستم تقویتی ستودنی است اما جزئیات کارکرد آن مربوط به محدودیتهای تاریخی آن است. به نظر میرسد خزندگان تنها یک استخوان در گوش خود دارند، اما استخوانهای دیگری در آرا‌اره دارند که پستانداران فاقد آن هستند. ظاهرا این استخوانهای آرا‌اره در پستانداران تغییر نقش یافتهاند. بنابراین شکل و پیکر بندی دقیق ساختمان گوش ما، پیشینه تکاملی ما را حداقل به اندازهای که مسأله شنیداری را حل کند، بازتاب مینماید. [27]

_config.yml

گرچه تارهای عصبی ضربدری و استخوانهای تغییر نقش یافته آرواره ممکن است شبیه تنظیماتی زیر حد مطلوب به نظر برسند، اما ما انتظار نداریم که تکامل لزوما با هر تغییر در کنامِ زیستمحیطی یک موجود زنده، او را به کمال مطلوب برساند. یا حداقل تشخیص میدهیم که چنین عملی او را به شدت به تغییرات زیستمحیطیِ بیشتر حساس میکند. از سوی دیگر استفاده ناگزیر از مواد موجود، نوعی محدودیت مفید را اعمال میکند. این موضوع باعث میشود محیط زیست نتواند تغییرات شدیدی را در ساختار ارگانها بوجود بیارد و احتمال بیشبرازش‌شدن نیز کاهش پیدا میکند. وقتی که یک گونه توسط گذشته محدود میشود، باعث میشود که ما به شکل ناکاملتری با زمان حال که برای ما شناخته شده است سازگار شویم، اما به قوی نگه داشتن ما برای آیندهای که نمیشناسیم کمک میکند. یک نگرش مشابه ممکن است به ما در مقاومت در برابر مدهای با حرکت سریع در جامعه بشری کمک کند. وقتی این مدها وارد فرهنگ میشوند، “سنتها” نقش محدودیتهای تکاملی را بازی می‌کنند. کمی محافظهکاری، یک تعصب خاص نسبت به گذشته، میتواند ما را در برابر چرخه رونق و از رو‌نق‌افتادن مدها ایمن کند. البته این به هیچ وجه به این معنا نیست که ما باید جدیدترین اطلاعات را نادیده بگیریم.

در یادگیری ماشینی، مزیتهای حرکت آهسته، در یک روش تنظیم با عنوان توقف اولیه، به طور کاملا عینی پدیدار میشود. وقتی در ابتدای مطلب به دادههای نظرسنجی ازدواج در آلمان نگاه کردیم، مستقیما سراغ بررسی مدلهای یک، دو، و نه-فاکتور با بهترین برازش رفتیم، با این حال، در بسیاری از موقعیتها، تنظیم پارامترهایی برای یافتن بهترین برازش ممکن برای دادههای معین، یک فرایند خود به خودی است. چه اتفاقی میافتد اگر ما این فرایندها را زود متوقف کنیم و این بار به یک مدل به سادگی اجازه ندهیم که بیش از حد پیچیده شود؟ باز هم چیزی که در ابتدا ممکن است خجالتآور به نظر برسد مانند مردد بودن یا ناکامل بودن، ظاهر میشود، ولی در عوض این به عنوان یک استراتژی مهم در حق خودش است.

برای نمونه، بسیاری از الگوریتمهای پیشبینی با جستجو برای مهمترین یک-فاکتور به جای پریدن به مدل چند فاکتوره شکل می‌گیرند. آنها تنها پس از یافتن آن فاکتور اول، به دنبال مهمترین فاکتور بعدی برای افزودن به مدل میگردند، سپس فاکتور بعدی و به همین ترتیب. بنابراین، مدل می‌تواند قبل از آنکه بیشبرازش فرصت رخنه کردن در آن را پیدا کند، با توقف فرایند به طور کوتاه مدت، به سادگی از پیچیدگی کامل حفظ شود.

این نوع از موارد “جایی که زمان بیشتر به معنی پیچیدگی بیشتر است”، نشان دهنده بسیاری از تلاش‌های بشری است. صرف زمان بیشتر برای تصمیم‌گیری درباره چیزی، الزاما به این معنی نیست که تصمیم بهتری خواهید گرفت، اما تضمین میکند که به در نظر گرفتن فاکتور‌های بیشتر، فرضیات بیشتر، مزایا و معایب بیشتر، خطر بیشبرازش بیشتر خواهد شد.

زمانی که تام استاد شد دقیقا این تجربه را داشت. ترم اول که در حال تدریس اولین کلاسش بود، وقت زیادی را صرف تکمیل سخنرانی خود کرد‌ (بیش از ده ساعت آمادهسازی برای هر ساعت از کلاس). ترم دوم به طور متفاوتی تدریس کرد. او قادر نبود زمان زیادی را صرف کند و میترسید که این به یک فاجعه تبدیل شود. اما یک اتفاق عجیب افتاد: دانشآموزان کلاس جدید او را دوست داشتند. در واقع آنها این کلاس را بیشتر از اولی دوست داشتند. به نظر میرسید آن ساعتهای اضافهای که صرف جمع آوری جزییات بیش‌از‌حد میشد تنها دانشآموزان را گیج میکرد و منتهی به زده شدن آنها از سخنرانیهای دفعه بعد تام هنگام تدریس در کلاس میشد. مسأله مهمی که تام سرانجام آن را دریافت این بود که او سلیقه و قضاوت خودش را به عنوان نوعی معیار اندازهگیری برای دانش آموزانش استفاده میکرده است.

تأثیر “تنظیم” در تمام نقشهای یادگیری ماشینی نشان میدهد که ما میتوانیم با تفکر سنجیده و کار کمتر تصمیمهای بهتری بگیریم. اگر فاکتورهایی که ما ابتدا طراحی میکنیم احتمالا مهمترین آنها باشند، بنابراین، ورای یک نقطه خاص، تفکرِ بیشتر در مورد یک مسأله، نه تنها هدر دادن وقت و انرژی نیست بلکه ما را به راه حلهای بدتر هدایت میکند. اما تبدیل این مسأله به یک توصیه عملی نیازمند پاسخ به یک سؤال دیگر است: ما چه زمانی باید تفکر را متوقف کنیم؟

برسیم به جمله اول، چه وقت کمتر فکر کنیم؟

با تمام مشکلاتی که بیش‌برارزش به وجود می‌آورد، اینکه چقدر زود توقف کنیم وابسته به شکاف بین چیزی که میتوان اندازه‌گیری کرد و چیزی که واقعا اهمیت دارد، است. اگر همه حقایق را دارید و آنها عاری از خطا و عدم قطعیت هستند و از طرفی می‌توانید مستقیما آن چیزی را که برای شما اهمیت دارد را ارزیابی کنید، پس زود توقف نکنید، طولانی و سخت فکر کنید: پیچیدگی و تقلا قابل تقدیر هستند. [28]

اما تقریبا هیچ وقت اینگونه نیست، اگر همه چیزی که شما دارید عدم قطعیت و داده محدود است، پس زود توقف(stop early) کنید. هر چه عدم اطمینان بیشتر باشد، فاصله بین آنچه می توانید اندازه گیری کنید آنچه مهم است بیشتر میشود و باید مراقب بیش‌بر‌ارزش باشید. هرچه خواهان سادگی بیشتر هستید باید زودتر توقف کنید.

وقتی که واقعا در تاریکی قرار‌گرفته اید، بهترین نقشه‌حساب‌شده، ساده ترین آنهاست. وقتی انتظارات ما غیرقطعی و داده ها سرشار از نویز هستند کلی‌نگر باشید و به اصل موضوع فکر کنید.

به قول جیسون فرید و داوید هانمن هانسون که در کتاب بازنگری خودشون میگوید:

هنگامی که شرو‌ع به طراحی چیزی می‌کنیم، ما ایده ها را به جای طراحی کردن با یک خودکار‌نوک‌ساچمه‌ای (همان خودکار عامه خودمان) با یک مارکر(ماژیک) ضخیم‌نوک طراحی می‌کنیم. چرا؟ چون خودکار خیلی ظریف است و وضوح‌ بالایی دارند. این موارد،تشنجی را در شما بوجود می‌آورد که نگران چیزهایی باشید که هنوز اهمیت ندارند، مثل: تکمیل کردن سایه گذاری یا اینکه از نقطه چین استفاده کنید یا نه. در نهایت، بیشتر تمرکز شما روی مواردی خواهد بود که هنوز اهمیت ندارند. در عوض وقتی از یک مارکر ضخیم‌نوک استفاده می‌کنید، امکان رسم جزییات را ندارید، فقط می‌توانید خطوط و اشکال ساده ای را رسم کنید، این خیلی خوب است. تصویر کلی همه چیزی است که شما باید در شرو‌ع رو‌ی آن تمرکز کنید.

برگردیم به مسئله ازدواج داروین، مسئله داروین”اینکه آیا پیشنهاد ازدواج دهد یا خیر” شاید می‌توانست با در نظر همان دو سه نقاط مثبت و منفی اولیه حل شود، موارد بعدی، حاصلی جزء وارد کردن اضطراب، اتلاف وقت و تاثیر چندانی در تصمیم نهایی نداشتند از طرفی هیچ کمکی به شفاف شدن پرو‌سه تصمیم گیری نکردند.

چیزی که شاید به ذهن داروین خطور کرد این بود “غیرقابل تحمله که یک عمر را مثل یک زنبور کارگر کار کنم و در نهایت به چیزی نرسم” همان دو مورد اول یعنی فرزندان و همراهی موارد اساسی بودند که او را تشویق به ازدواج کرد، موراد دیگر مثل بودجه کتابش بیشتر شبیه آشفتگی بودند.

داروین مثل فرانکلین نبود که چندین رو‌ز وقت بگذارد و لیست بلند بالایی از این موارد را در دفترچه روزانه‌اش یاداشت کند. علارغم تصمیم مهمش که زندگیش را تغییر میداد، دارو‌ین تصمیش را دقیقا هنگامی گرفت که به انتهای صفحه رسید. این داستان دقیقا یادآور دو مفهوم “توقف زودهنگام” و “لاسو” است. وقتی دارو‌ین تصمیم به ازدواج گرفت در صفحه بعد دوباره لیستی از نقاط منفی و مثبت رفتن به ولز نوشت اما همینطور که به پایان صفحه رسید نوشت “ مهم نیست، شانست را امتحان کن”. بعد از چند ماه این دو با هم ازدواج کردند که شروع یک زندگی سرشار از شادی و همنشینی بود.آیا تا به حال در زندگی روزمره تان درگیر بیش‌برارزش شده اید؟ چگونه؟ در ابتدای پست از کش مکش من با معلم سخن گفتمبه نظر شما آیا این شیوه توضیح دادن مفاهیم کمک به سیال شدن هر چه بیشتر ذهن دانش آموزان نمیکند؟

منابع

(1)The Correspondence of Charles Darwin, Volume 2: 1837-1843

(2)From Benjamin Franklin to Joseph Priestley, 19 September 1772

(3)Reexamining adaptation and the set point model of happiness: Reactions to changes in marital status.

(4)Thou shalt not make unto thee any graven image

(5)Kings 18:4

(6) Stumbling on Happiness by Daniel Gilbert

(7) Epee 2.0: The Birth Of The New Fencing Paradigm

(8)The Lost Steve Jobs Tapes

(9)How to Start a Startup

(10)5 Avinash Kaushik blogs every digital marketer should read

(11)How to Use a Shooting Range