چه وقت کم تر فکر کنیم! بررسی پاره ای از مفاهیم یادگیری ماشینی از یک دیدگاه فلسفی
- Overfitting
- Cross-Validation
- Regularization
معلم ریاضی درس جدید رو شروع کرد و بدون مقدمه شروع به نوشتن فرمول کرد، اما من پافشاری کردم که قبل از ارائه فرمول فلسفه آن را شرح دهد، بعد از کمی کشمکش مجبور شدم کلاس را ترک کنیم.
در علم منطق دو مفهوم اساسی وجود داره: یک) منطق تصورات که با تعارف سروکار داره دو) منطق تصدیق یا استدلال (منطق علمیه که روش کلان تفکر را به انسان میآموزه). من فلسفه را به عنوان تعریف مفاهیم میشناسم و تصدیق را به عنوان تبدیل تصورات به روابط ریاضی. یکی از مشکلاتی بزرگی که من به اون در این کلاس بهش خورده گرفتم این بود که قبل از ارایه هر علم باید فلسفه آن شرح داده شه. درسته مطالعه علم منجر به تولید دانش میشه اما فلسفه به ما بینش میده.
به نظر من فلسفه به دو علت مهمه :
1) فلسفه میتونه کمک بسزایی به ما در پروراندن قدرت انتقادیمان کنه 2) روش خوبیست برای یادگرفتن چیزهای خاص است. در این پست سعی دارم یکی از مفاهیم موجود در یادگیری ماشین که زیاد باهاش سروکار داریم به نام بیشبرارزش که من دوست دارم اون را “پرستش داده” نام گذاری کنم، بپردازم و نشون بدم که داشتن یک دیگاه فلسفی چقدر میتونه ما را در شرح مسایل کمک کنه. نوشتن این مطلب وقت زیادی را از من گرفت، و مطمینا خالی از اشکال نیست، لطفا با تامل بخوانید و نظراتتون را از طریق توییر با من در میان بگذارید.
چه وقت کمتر فکر کنیم!
وقتی چارلز داروین داشت به این فکر میکرد که آیا به دختر خاله خودش، اِما وجوود پیشنهاد ازدواج بده یا نه، یه کاغذ و قلم برداشت و تمامی نتایج احتمالی که ممکنه در آینده رخ بده، را ورانداز کرد.
یک لیست دو سطری تهیه کرد که یک طرف به جوانب مثبت ازدواج مثل فرزند،مصاحبت ، گپ زدن با زن و لذت گوش دادن به موسیقی اختصاص داشت و طرف دیگر آن به وحشت از دست دادن زمان، فقدان آزادی به این مفهوم که هر جا دلش بخواد برود، تحمل بار ملاقات خویشاوندان، خرج و اضطرابی که فرزندان با خودشون به همراه دارند، نگران این موضوع بودن که ممکنه همسرش، لندن را دوست نداشته باشد و اینکه پول کمتری داشته باشد که بخواد کتاب خرید کند. وقتی گزینه هایی که لیست کرده بود را سبک و سنگین کرد، رگه هایی از پیروزی در قسمت جنبه های مثبت ازدواج پدیدار شد و داروین در انتهای لیستش نوشت: “ازدواج،ازدواج،ازدواج Q.E.D “.
Q.E.D مخفف quod erat demonstrandum است که در ریاضی معمولا در انتهای اثبات ها نوشته میشود به معنی “اثبات شد آنچه که باید میشد” این کلمه در واقع از یک کلمه یونانی گرفته شده که اولین بار توسط خود داروین به انگلیسی برگردانده شد، منظور داروین از این عبارت در انتهای لیست این بود که “به اندازه کافی اثبات شد تا ازدواج کنم”. [1]
در زمان داروین، این لیست جنبه های مثبت و منفی، یک الگوریتم “مورد احترام و ریشه دار” بود که یک قرن پیش توسط بنجامین فرانکلین بوجود آمده بود. این الگوریتم که به تکنیک دو ستونی فرانکلین در تصمیمات دشوار معروفه از زبان فرانکلین این گونه شرح داده میشه :
راه من اینست، یک صفحه از کاغذ را با یک خط به دو ستون تقسیم میکنم: یک ستون به نام جنبه های مثبت و ستون دیگر به نام جنبه های منفی. سپس ظرف مدت سه یا چهار روز، در هر ستون شواهد مربوط به جنبه های مثبت و منفی را در تحقق یادداشت میکنم. وقتی در طول این چند روز تمامی مواردی که به ذهنم رسید را یاداشت کردم به بررسی اهمیت موارد یادداشت شده میپردازم. اگر در هر ستون مواردی وجود داشته باشد که از لحاظ اهمیت هم وزن باشند، هر دو خط میخورند. اگر یک جنبه مثبت معادل دو جنبه منفی باشد، آنوقت هر سه خط خواهند خورد. به همین ترتیب در نهایت مشخص میشود که تعادل به نفع کدوم تصمیم هست و به این شکل یقین حاصل میشود.
اما نتیجه این الگوریتم اینه که هرچند وزن جنبه های مثبت و منفی نمیتوانند با کیفیت جبری (از دیدگاه ریاضی) سنجیده شوند، اما فرانکلین اعتقاد داره، زمانی که آنها به صورت مقایسهای تحلیل میشوند، میتواند بهتر قضاوت کند و احتمال تصمیمگیری عجولانه کمتر میشود.فرانکلین میگوید: من از این نوع معادله بسیار سود بردم به طوریکه آن را Moral Algebra نام گذاری میکنه. [2]
در تصویر زیر لیست دو ستونی داراین نمایش داده شده که مربوط به جولای 1838 هست.
وقتی در مورد “تفکر کردن” میاندیشیم، شاید به نظر ساده بیاد که هر چه بیشتر فکر کنیم بهتره، به عنوان مثال، شما میتونین تصمیم بهتری بگیرین وقتی لیست بلندتری از جنبه های مثبت و منفی داشته باشین، هر چه فاکتور های مناسب بیشتری شناسایی کنید، میتونین پیش بینی بهتری در بازار سهام داشته باشین و هر چه زمان بیشتری صرف نوشتن یک گزارش کنید مطلب بهتری از آب در میاد. مطمینا این همون چیزیه که الگوریتم فرانکلین پایه اساس بحث خودش قرار داده. از این دیدگاه، روش”جبری” داروین برای ازدواج علارغم غرابتش (یا شاید بی قاعدگیش) به صورت شگفت آوری و حتی بطور قابل ستایشی منطقی به نظر میرسه.
هر چند اگه فرانکلین یا داروین تا عصر یادگیری ماشینی دوام آورده بودن (علمِ آموختن تصمیم گیری صحیح از تجربیات پیشین به رایانه ها)، میدیدن که پایه های Moral Algebra شون داره میلررزه. این سوال که چقدر سخت (زیاد) بیندیشیم و چند تا فاکتور را مد نظر قرار بدیم یک گره کور در یادگیری ماشینی و احتمالاته، که محققین این زمینه به اون “بیش برارزش” میگن. برای کنار اومدن با این مشکل یک تدبیر وجود داره که میگه کم تر فکر کنیم! اگه از این مفهوم آگاه باشیم روش ما برای تخمین مارکت و … تغییر میکنه.
هر تصمیمی (که به صورت روزمره میگیریم) در واقع یک نوع پیش بینیه به عنوان مثال چقدر به چیزی علاقه خواهید داشت قبل از اینکه حتی امتحانش کنید، یا اینکه روند بازار x چطور پیش خواهد رفت و غیره. هر پیش بینی، الزاما شامل فکر کردن در مورد دو موضوع متمایزِ “چیزهایی که میدونید و چیزهایی که نمیدونید” است. در واقع این دو موضوع تلاشیه برای تدوین کردن یک تئوری، تئوری که تجربیاتی را که تا به امروز آموخته اید را به حساب خواهد آورد و چیزهایی درباره آینده، آینده ای که شما حدس میزنید، خواهد گفت. یک تئوری خوب، البته هر دو را انجام خواهد داد، اما حقیقت اینه که در هر پیش بینی یک کشش غیر قابل اجتنابی وجود داره. برای روشن تر ساختن این کشش بیاین یک نگاه به داده هایی که ممکنه به داروین مربوط باشه داشته باشیم: رضایت زندگی افراد بر 10 سال اول ازدواج آنها، طبق یکی از تحقیقات اخیر که در آلمان انجام شد. [3]
هر نقطه در نمودار پایین، از این تحقیق گرفته شده و کار ما در اینجا ارایه یک فرمول برای خطی است که از میان این نقاط عبور میکند و در آینده نیز امتداد خواهد داشت، خطی که به ما این امکان را میده که یک پیشبینی با توجه به داده های 10 سال پیش انجام بدیم. یک فرمول احتمالی میتونه فقط از یک فاکتور برای پیش بینی رضایت زندگی استفاده کنه: “زمانی که از ازدواج گذشته”. این فرمول یک خط راست را بوجود میاره. یه احتمال دیگر میتونه استفاده کردن از دو فاکتور زمان ومربع زمان باشه، که در نتیجه باعث بوجود اومدن یک خط U شکل میشه که توسط اون میتونیم به صورت بالقوه، رابطه پیچیده تری بین زمان و خوشبختی پیدا کنیم. اگر ما همینطور این فرمول را برای اضافه کردن فاکتور های بیشتر بسط بدیم، خطی که از این رابطه بدست میاد، منعطفپذیر تر خواهد شد و از نقاط بیشتری عبور خواهد کرد. وقتی تعداد فاکتور هایمان به 9 تا افزایش پیدا کنه فرمول ما میتونه روابط خیلی پیچیده ای را ضبط کنه.
به زبان ریاضی، مدل دو-فاکتور ما تمامی اطلاعاتی که در مدل یک-فاکتور وجود داره، را در بر میگره، همینطور مدل 9-فاکتور با یک اعمال نفوذ تمامی نقاطی که از نظر دو مدل اول دور مانده اند را در بر میگیره. با این استدلال، به نظر میرسه که مدل 9-فاکتور بایستی همیشه بهترین پیش بینی را ارایه بده، اما به این سادگی ها هم نیست! نتایج اعمال سه مدل بر روی داده ها در شکل زیر نمایش داده شده است:
مدل یک-فاکتور، به طرز شگفت آوری محل دقیق تعداد زیادی از نقاط را از دست میده (به حساب نمیاره)، اما روند (امتداد) اصلی دادها را ضبط میکنه. با این حال، این پیش بینی خطی به کاهش خود ادامه خواهد داد و در نهایت به بدبختی نامحدود ختم خواهد شد! یه چیزی در مورد این مسیر کاملا درست به نظر نمیرسه. مدل 2-فاکتور ما نسبت به مدل اول از شرایط بهتری برخورداره، با این مفهوم که بیشتر با اطلاعات نظرسنجی همسازه و شکل تقریبا منحنی اون پیش بینی بلند مدت متفاوتی را نشون میده، با این مضمون که بعد از کاهش اولیه رضایت زندگی، روند این نزول شامل افت و خیز های بیشتری در طول زمان خواهد بود. در نهایت مدل 9-فاکتور از میان تمامی نقاط نظرسنجی عبور میکنه، اساسا این مدل، یک مدل درخور برای تمامی داده های این نظرسنجی هست، اما اگر به نتایج پیش بینی شده این مدل برای سالهایی که در تحقیق گنجانده نشده دقت کنید به موثر بودن این مدل پی خواهید برد!
چیزی که این مدل به ما میگه اینه: بعد از گذشت فقط چند ماه از ازدواج، سطح رضایت طرفین از یکدیگر به شدت افزایش پیدا میکنه و بعد از 10 سال کش و قوس به ناگهان رضایت به صفر میرسد. در مقابل، پیش بینی مدل 2-فاکتور سازگار تر با چیزهایی که روانشناسان و اقتصاددانان میگویند، است. (روانشناسان و اقتصاددانان بر این باورند که سطح رضایت زوجین به حالت عادی بر میگرده یعنی سطح “خط مبنا” رضایت انسان از زندگی- سطح رضایت حقیقی”). درسی که از این ماجرا میشه گرفت اینه:
این گفته مطمینا درسته که، به حساب آوردن تعداد فاکتور های بیشتر در یک مدل، اون را برای داده های موجود بیشتر شایسته میسازه، اما این “شایسته بودن” برای داده های کنونی الزاما به معنای یک پیش بینی بهتر نیست!
در شکل زیر به وضوح نشان داده شده که اضافه کردن مقدار ناچیزی نویز تصادفی به داده ها میتونه نتایج وحشتناکی در مدل 9-فاکتور بوجود بیاره، درحالی که دو مدل 1 و 2-فاکتور نسبت به مدل 9-فاکتور پایدار و سازگار تر هستند.
بدیهیست، مدلی که بسیار ساده است به عنوان مثال، یک خط راست از یک فرمول یک فاکتوره نمیتونه الگوی اصلی موجود در داده ها را به خوبی ضبط کنه. اگر “حقیقت داده ها” شبیه یک منحنی باشه، هیچ خط راستی نمیتونه اون را یاد بگیره. از طرف دیگر،یک مدل که بسیار پیچیده است مثل مدل 9-فاکتور خودمون، نسبت به نقاط خاصی از دادها ها بیش از حد حساس میشود. به عنوان یک پیامد، چون این مدل به طور موشکافانه ای به داده های خاص دیتاست وفق داده شده، نتایج بسیار متغیری را تولید میکند. این چیزیست که آمار شناسان به اون بیش برارزش میگویند.
یکی از عمیق ترین حقایق یادگیری ماشین اینست که : همواره خوب نیست که از یک مدل “پیچیده تر” استفاده کرد، مدلی که فاکتور های بیشتری را به حساب میآورد. اما مسئله مهمتر اینست: چگونه پیچیدگی یک مدل را توجیه کنیم، و یا اینکه تا چه میزان پیچیدگی یک مدل قابل توجیه است؟
بیش برارزش یا “پرستش داده” ؟
اگر مجموعه عظیمی از داده ها را داشته باشیم و این مجموعه داده بگونه ای جمع آوری شده باشند که تهی از هرگونه اشتباه احتمالی باشند، بگونه ای که دقیقا نمایانگر موضوعی که ما میخواهیم ارزیابی کنیم باشند استفاده از پیچیده ترین مدل موجود قطعا بهترین نتایج را بهمراه خواهد داشت. اما اگر بخواهیم مدلمان را به شکل عالی به دادهایمان برارزش (fit) کنیم زمانیکه که یکی از آن فاکتور ها نتواند همیشه ثابت باقی بماند آنگاه ما در دام بیش برارزش میافتیم.
به عبارت دیگر، بیش برارزش زمانی ظهور پیدا میکند که ما با نویز یا اندازه گیری های اشتباه سروکار داریم (چیزی که همیشه اتفاق میافتد!). میتونه خطاهایی در جمع آوری داده ها وجود داشته باشه، یا اینکه چگونه گزارش شده اند. گاهی اوقات، موضوع مورد اکتشاف ما به عنوان مثال خوشبختی، حتی به سختی تعریف میشوند، یا تعریف جامعی در مورد آنها وجود ندارد، چه برسد به اندازه گیری آنها!
در طول تاریخ، متون مذهبی پیراانشان را در مقابل بت پرستی هشدار داده اند: پرستش مجسمه ها، نقاشی ها، بقایای فیزیکی قدیس ها و سایر محصولات مصنوعی قابل لمس. به عنوان مثال تصویر زیر جزء اولین فرمانهای عهد عتیقه که کوتاه شده یکی از ده فرمان طبق کتاب سفر تثنبه است که مضمونی با این عنوان داره: صورتی تراشیده و هیچ تمثالی از آنچه بالا درآسمان است، و از آنچه پایین در زمین است، و ازآنچه در آب زیر زمین است، برای خود مساز. نزد آنها سجده مکن، و آنها را عبادت منما … [4]
در کتاب پادشاهان آورده شده، که موسی به دستور خدا یک مار از جنس برنز ساخت و آن را بر روی چوبی سوار کرد. هر کس که توسط این مار گزیده شده بود با نگاه کردن به اون دوباره شفا یافت. بعد از این جریان، تندیس مار به عنوان بت به پرستش در آمد (به جای خود خدا) [5]
به قول مولوی که میگه: مادر بت ها بت نفس شماست زانکه آن بت مار و این بت اژدهاست
اساسا بیش برارزش نوعی “بت پرستی داده” است، با پیامد تمرکز بر روی آنچه که قادر به اندازه گیری هستیم نه آنچه که اهمیت دارد.
این شکاف بین داده ها و پیش بینی مورد انتظار ما، کمابیش در همه جا وجود دارد. هنگامی که یک تصمیم بزرگ میگیریم، فقط میتونیم راجع به چیزی که بعدا خوشحالمان میکند با فکر کردن در مورد فاکتور هایی که اکنون برایمان مهم هستند اظهار نظر کنیم. به قول دنیل گیلبرت استاد راانشناسی دانشگاه هاروارد: آینده ما اغلب “پول خوبی برای پاک کردن خالکوبی هایی که قبلا ما برای گرفتن اونها پول خوبی پرداختهایم ، میپردازد” . [6]
هنگامی که میخواهیم یک پیش بینی مالی را انجام بدیم، ما فقط میتونیم به آنچه که به قیمت سهام در گذشته وابسته بوده نگاه کنیم نه چیزی که در آینده ممکنه وابسته باشه. حتی در فعالیت های کوچک روزمره مان این الگو وجود دارد. داده های پیرامون ما سرشار از نویز هستند، در نتیجه اگر فاکتور های بیشتری در مسئله مورد مناقشه دخیل کنیم میتونه ما را به سمت خطای بهینه سازی برای چیز اشتباهی سوق بده (یعنی یادگرفتن نویز موجود در داده ها توسط مدل نه الگوی حقیقی داده ها).
در نظر گرفتن فاکتور های بیشتر و بیشتر، و تلاش گستره تر برای مدل کردن آنها میتونه ما را به سمت خطای بهینه سازی برای مسئله اشتباه سوق بده، “سوق دادن نیایشگران به “مار برنزِ داده” به جای قدرت عظیم که در پرتو آن قرار گرفته است.(استعاری از داستان عصای موسی)”
بیش برارزش در همه جا
بیش برارزش در واقع در همه جا یافت میشود، به عنوان مثال “حس چشایی” را در نظر بگیریم. چطور ممکنه غذاهایی که بهترین مزه را برای ما دارند به طور گسترده ای برای سلامت ما مضر باشند مادامیکه وظیفه اصلی حس چشایی ما از دیدگاه تکاملی بازداشتن ما از خوردن چیزهای بد هست؟
طعم و مزه یک شاخص اندازه گیری سلامت در بدن است. چربی، قند و نمک مواد مغذی مهمی هستند و برای چند صد هزار سال، خوردن غذاهای حاوی آنها یک معیار مناسب برای یک رژیم غذایی پایدار بوده است. اما داشتن توانایی اصلاح غذاهای موجود، میتونه این رابطه را در هم بشکنه. با این تفاسیر می تونیم چربی و قند را به صورتی به مواد غذایی اضافه کرد که فراتر از مقادیری باشه که برای بدن ما مفید است، و سپس این غذاها را به صورت انحصاری به جای غذاهایی که از ترکیب گیاهان، گوشت و … (غذاهایی که از لحاظ تاریخی رزیم غذایی انسان را تشکیل میداده ) درست میشن را مصرف کرد. به عبارتی میتونیم طعم و مزه را به یک فرد تحمیل کنیم. (یا حس چشایی اون شخص را بیش برارزش کنیم). هرچه ماهرانه تر غذاهای موجود را اصلاح کنیم (و هرچه سبک زندگیمان از اجدادمان فاصله بگیرد)، شاخص طعم و مزه ناقص تر خواهد شد. این فاکتور اندازه گیری در بدن یعنی حس چشایی آفت جان انسان شده و ما را به شکل خطرناکی قادر میسازه که دقیقا همون چیزی که ما میخواهیم را داشته باشیم حتی اگه اون چیز بد باشه (یا اون دقیقا چیز درست نباشه).
وقتی به باشگاه میروید تا اون اضافه وزنی که در نتیجه خوردن مواد قندی بدست آوردید را آب کنید ، ممکنه در دام بیش برارزش تناسب اندام گیر کنید. برخی از علائم تناسب اندام به عنوان مثال، پایین بودن چربی و بالابودن حجم توده عضلانی بدن را میشه به سادگی اندازه گیری کرد و این علایم، به پایین بودن خطر بیماری های قبلی و سایر بیماری ها مربوط هستند. اما این موارد میتوانند شاخص اندازه گیری ناقص باشند. بیش برارزش کردن این علائم یعنی اتخاذ کردن یک رزیم غذایی افراطی برای پایین آوردن چربی بدن و خوردن هورمون های استراییدی برای پرورش عضلات شاید بتونه تصویری از سلامت خوب را در ذهن تداعی کنه، اما این فقط یک تصویره.
بیش برارزش همچنین میتونه در ورزش رخ بده، به عنوان مثال، سامان از زمان نوجوانی یک شمشیرباز بوده. هدف اصلی شمشیر بازی در گذشته آموزش دادن چگونگی دفاعازخود به افراد در یک مبارزه تنبتن بود و شمشیر هایی که امروزه در مسابقات استفاده میشود شبیه به شمشیر های قدیمی هستند که برای اینجور رخ دادهایی استفاده میشد. ( مخصوصا در مسابقات اسلحه اپه که امراز شاهدش هستیم).در ویدئوی زیر نمونهای از شمشیر بازی در سال 1967 در فرانسه نمایش داده شده:
اما از سال 1988 استفاده از ابزار های الکترونیک در مسابقات مرسوم شد و به این ترتیب ، قوانین جدید در سراسر دنیا به اجرا در آمد .با معرفی ابزارهای الکترونیکی ثبت امتیاز (در نوک تیغه دگمه ای وجود داره که در صورت وارد شدن ضربه ای با نیروی مناسب به بدن حریف ، ضربه را روی دستگاه مخصوص ثبت می کند) ذات این ورزش هم تغییر کرد و مهارت های بدردنخوری که در یک مبارزه تنبتن اصلا به کار شما نمیاد به شکل مهارتهای حیاتی درآمدند. شمشیرهای امرازی از یک تیغه انعطاف پذیر استفاده میکنند که به مبارزان این امکان را میدهد که با وارد کردن ضربه آهسته و فشردن این دگمه بر بدن حریف امتیاز کسب کنند. در نتیجه چیزی که امروز در این ورزش شاهدش هستیم بیشتر شبیه کتک کاری با یک لایه فلزی نازک است نه ضربههای مهیب و بریدن! این ورزش امروزه طرفداران بسیاری دارد و نسبت به گذشته مهیج تر شده، اما هنگامی که یک ورزشکار تاکتیک هایش را به گرفتن امتیازات بیشتر یا امتیاز ندادن بیش برارزش میکند، در شمشیر بازی دنیایی واقعی این مهارت ها را غیر سودمند خواهد یافت. [7]
شاید هیچ جا بیش برارزش به قدرتمندی و مشکل سازیِ دنیای کسب و کار نباشد، جایی که قوانینی به عنوان “ساختار های تشویقی کار” وجود دارد. استیو جابز میگه:
خیلی مراقب باشید که افراد را به انجام دادن چه چیزی تشویق میکنید، زیرا انواع مختلف ساختارهای تشویقی میتواند پیامدهایی را به همراه داشته باشد که شما نمیتوانید آنها را پیش بینی کنید. [8]
سم آلتمن مدیر استارت آپ وای کامبینیتر نکته ای که استیو جایز گفت را مجددا گوشزد میکنه:
واقعا این موضوع حقیقت دارد که شرکت چیزی را میسازد که موسس آن تصمیم به سنجش آن دارد. [9]
یکی از کلاس های استنفورد که برای من جالب بود کلاس CS183B بود که در سال 2014 توسط سم آلتن در این دانشگاه برگزار شد. این کلاس به چگونگی ایجاد یک استارت آپ میپردازد. سم آلتمن قبلا دانشجوی این دانشگاه بود اما بعدها دانشگاه را برای ساختن شرکت خودش ترک کرد. ویدیو لکچر اول:
در حقیقت، خیلی سخته که بتوان معیار های سنجش و انگیزشی را بوجود بیاوریم که عواقب انحراف کننده ای نداشته باشد. به عنوان مثال کارخانه ای با تمرکز بر روی شاخص تولید، ناظران را به این سمت پیش میبره که از نگهداری و تعمیر دستگاه ها غفلت کنند و باعث بوجود آمدن فجایع در آینده نزدیک شوند.
از نمونه دیگر اینگونه شاخص ها میتوان به تبلیغات اینترنتی اشاره کرد. آویناش کوشیک مسئول بازاریابی دیجیتال گوگل هشدار میدهد که تلاش برای جلب نظر کاربران سایت به دیدن تبلیغات بیشتر مساویست با پرکردن وب سایت با تبلیغات متنوع . وقتی به شما بر مبنای هزینه به ازای نمایش پول پرداخت میشود مشوق اصلی شما برای کسب در آمد بیشتر “به نمایش گذاشتن تبلیغات بیشتر در صفحات و مطمین شدن از اینکه کاربران بیشتری این تبلیغات را می بینند”، است. این انگیزه تمرکز از یک موجودیت مهم به نام مشتری (کاربر) دور کرده و آن را به سمت تبلیغ کننده میبرد. شما ممکنه در کوتاه-مدت پول بیشتری بدست بیارید اما نمایش تبلیغات زیاد و مقالات انباشه شده با تبلیغات و عناوین غلوآمیز کاربران وبسایت شما را در بلند-مدت فراری میدهد. [10]
در برخی از موارد تفاوت بین یک مدل و دنیای واقعی به راستی مسئله بین مرگ و زندگیست. در ارتش و نیروی انتظامی، به عنوان مثال، تکرار و بهیادسپاری یک شیوه کلیدی برای القای مهارت های خطآتش به شلیک کنندگان است. هدف این است که حرکات و تاکتیکهای مشخص را تا حدی به اونها آموزش بدهند که این پروسه به صورت کاملا خودکار برای آنها تبدیل شود. اما هنگامی که همین مامورین در دام بیشبرارزش گیر بیفتند میتواند فاجعه ساز شود.
داستانهایی وجود دارد از افسران پلیس که به عنوان مثال بعد از شلیک زمانی را صرف برداشتن فشنگ های خالی از روی زمین کردند و آن را در جیب خود گذاشتند بدون آنکه متوجه اینکار باشند، این کار یکی از آداب خوبی است در سالن های تیراندازی فرا میگیرند. [11]
ديو گراسمن سرهنگ دوم سابق ارتش آمريكا و استاد راانشناسي آکادمی نظامی ایالات متحده معروف به وست پوينت مینویسه: “در بسیاری از تیراندازی های واقعی بعد از اینکه کش مکش پایان میابد، مامورین از اینکه فشنگ های خالی را در جیبشان دیدند بدون داشتن هیچ ذهنینی از اینکه چگونه اونجا قرار گرفته اند، بسیار شگفت زده شدند. در موارد بسیاری، مامورین مرده با فشنگهای خالی در دستشان پیدا شد، که به همین علت در وسط رویه اجرایی تیر خورده بودند” [12]
حتی در FBI مواردی وجود داشته که مامورین بعد از اینکه دو شلیک همزمان به هدف انجام میدادن تفنگ خودشون را غلاف میکردند بدون توجه به اینکه آیا به هدف شلیک کردند یا خطری اونها را تهدید میکنه. مامورین این روش تیراندازی را در آموزشهای نظامی فرا گرفته بودند. خطاهایی از این دست در مراکز نظامی به training scars معروف هستند. training scars به عادت های بدی اشاره داره که مامورین در حین آموزش فرا می گیرند. تمام این موارد منعکس کننده این واقعیت است که شخص میتواند به آماده سازی خودش نیز بیش برارزش شود! حتی در یک مورد تلخ، بعد از اینکه یک مامور اسلحه را از دست مهاجم گرفت، آن را به طور غریزی به مهاجم پس داد، این کار منجر به مرگ او شد، تمرینی که مکررا با مربی خود انجام داده بود. [13]
تشخیص دادن بیشبرارزش: اعتبار سنجی متقاطع
چونکه بیشبرارزش، نخست خودش را به عنوان یک تئوری نشان میدهد که به شکل خیلی خوبی دادههای موجود را بیشبرارزش میکند، ممکنه به نظر سخت بیاد که بتوان تشخصش داد. چگونه میتوان تفاوت بین یک مدل خوب و مدلی که در دام بیشبرارش گیر کرده را فهیمد؟ در یک محیط آموزشی چگونه میتوان بین یک کلاس از دانشآموزان که در موضوع اصلی(مورد اهمیت)، سرآمد هستند و کلاسی که دانش آموزان برای آماده شدن برای امتحان آموزش داده میشوند [14]، تمایز قائل شد؟(همانند تفاوت بین دو مفهوم موضوعیت و طریقت)
در دنیای کسب و کار، چگونه میتوان بین یک فرد متخصص و یک کارمند که به طرز زیرکانهای کارش را به سمت شاخصهای عملکرد کلیدی شرکت یا برداشت رئیسش از وی برارزش میکند، تمایز قائل شد؟ در هم شکستن این سناریوها مطمئنا چالش برانگیز است، اما غیرممکن نیست.
یادگیری ماشینی چندین استراتژی غیرانتزاعی برای تشخیص بیشبرارزش ارائه داده و یکی از مهمترین آنها مفهومی است به نام اعتبارسنجیمتقاطع.
به بیان ساده، اعتبارسنجیمتقاطع یعنی ارزیابیِ نه تنها چقدر خوب مدل دادهایی را که به آن داده میشود را برارزش میکند، بلکه تا چه میزان به داده هایی که ندیده، عمومیت میبخشد. در مثال ازدواج، ما ممکنه دو نمونه آموزشی را به صورت تصادفی کنار بگذاریم و مدلمان را به 8 نمونه آموزشی باقیمانده برارزش کنیم، سپس از دو نمونه کنارگذاشته شده به عنوان نمونه های آزمایش استفاده کنیم تا دریابیم مدل ما تا چه میزان قابل تعمیم به داده های مستقل از داده های آموزش است. دو نمونهی آزمایش در واقع همانند قناری در معدن سنگ عمل میکند(در گذشته از قناری در معادن ذغال سنگ به عنوان آژیر خطر استفاده میشد، چنانچه گاز دیاکسیدکربن یا متان در معدن نشت میکرد، قناری زودتر از معدنکاران میمرد.) [15]: چنانچه مدل به خوبی از میان 8 نمونه آموزشی عبور کند اما دو نمونه آزمایش را از دست بدهد شرط خوبیست که دستِ بیشبرارزش در کار است.
جدای از کنارگذاشتن برخی از نمونههای آموزشیِ دردسترس (به عنوان مجموعه اعتبارسنجی)، شاید استراتژی بهتر، استفاده از دادههایی باشد که به شکل دیگری برای ارزیابی جمع آوری شده اند، همانطور که دیدید معیار اندازه گیری “مزه” همیشه نمیتواند عامل بازدارنده مناسبی برای خوردن غذای نامناسب باشد و ما در دام بیشبرارزش گیر افتادیم.
در مدارس، به عنوان مثال آزمون های استاندارد شده (آزمون استاندارد شده آزمونیست که اغلب توسط مدارس در سطح انبوه برای اندازهگیری پیشرفت تحصیلی دانشآموزان و یا مقاصد ارزشیابی دورههای تحصیلی تهیه و توزیع میشوند) که مزایایی مثل داشتن صرفه مقیاس متمایز ([صرفه مقیاس] در علم اقتصاد به معنی فرآوری زیاد که با ازدیاد فروش و کم شدن قیمت همراه است)، امکان تصحیح(نمره دهی) سریع و ارزانقیمت، دارند. در کنار اینگونه آزمونها، از طرف دیگر مدارس میتوانند به صورت تصادفی تعداد کمی از دانش آموزان به عنوان مثال یک نفر از هر کلاس یا از هر صد دانش آموز یک نفر توسط یک متد ارزیابی متفاوت سنجیده شوند مثل آزمون شفاهی.
آزمون های استاندارد شده فیدبک آنی میدهند، شما می توانید هر هفته یک آزمون کوچک کامپیوتری از دانش آموزان بگیرید و پیشرفت کلاس را به صورت بلادرنگ به صورت نمودار در بیاورید، در حالی که آزمون فرعی (به عنوان مثال آزمون شفاعی) در حکم اعتبار سنجی متقاطع عمل کنید، این کار با هدف اطمینان از اینکه دانش آموزان در واقع چیزی به دانششان اضافه میشود، انجام میگیرد نه صرفا بهتر شدن در آزمون دادن! اگر نتایج آزمون استاندارد شده افزایش پیدا کند در حالی که نتایج “آزمون غیر استاندارد” در جهت مخالف حرکت کند، این یک نشانه هشدار برای مدیران و معلمین خواهد بود که شرایط “آماده شدن برای امتحان” (شرایطی که دانشآموزان فقط برای موفق شدن در امتحانات درس میخوانند و از هدف اصلی آموختن دور میشوند) رخ داده، و مهارت های دانش آموزان شروع به بیشبرارزش کردن به فوتوفن خود آزمون شده است.
اعتبارسنجیمتقاطع همچنین یک پیشنهاد برای مامورین پلیس دارد که آنها را از یادگرفتن عادت های بد در پروسه آموزش باز میدارد. همانطور که آزمون شفاهی میتواند به عنوان یک اعتبارسنجیمتقاطع برای آزمون استاندارد شده عمل کند، ارزیابی گاهوبیگاه “آموزش متقاطع” میتواند معیار خوبی برای سنجش این موضوع باشد که آیا زمان عکسالعمل و دقت تیراندازی قابل تعمیم به کارهای غیرمعمول است یا خیر؟ اگر اینطور نباشد میتوان نتیجه گرفت که زمان تغییر در پراوسه آموزش فرا رسیده است. هرچند هیچ چیز شاید نتواند به واقع یک مامور پلیس را برای یک درگیری واقعی آماده کند، اما تمریناتی مثل این میتواند حداقل نشانگر این موضوع باشد که training scars میتواند در کدام قسمت از ماموریت شکل بگیرد.
چگونه با بیشبرارزش مبارزه کنیم: جریمه پیچیدگی
“اگر نتوانید چیزی را به سادگی توضیح دهید، پس آن را خیلی خوب نفهمیدهاید” این نقل قول عموما به آلبرت انیشتین منصوب داده میشه، هرچند این انتصاب به احتمال قوی جعلی است. در برخی از کتاب ها این نقل قول به صورت ناشناس آورده شده!
تا کنون برخی از روشهایی که میتوان از آنها برای تشخیص و اندازه گیری بیشبرارزش استفاده کرد شرح داده شد، اما چگونه میتوان این اثر را کم کرد؟ از یک دیدگاه آماری، بیش برارزش یک نشانه از بیشازحد حساس شدن مدل به داده های آموزش است.
یک راه برای انتخاب بهترین مدل، استفاده قاعده تیغ اوکام است، این قاعده میگوید: از میان دو نظریه که توان توصیف و پیشبینی یکسانی دارند، نظریه ساده تر را برگزینید. منظور از سادهتر نظریهای است که است که کمترین انگاشتها در آن به کار رفته باشد (به عبارت ساده اگر شما دو نظریه احتمالی دارید که همه شواهد موجود را در بر دارد، بهترین نظریه آن است که دارای اجزای متحرک کمتر است.) “همه شواهد موجود را در بردارد” جز مهم این قاعده است!
کلمه “سادهتر” در اینجا معنای خاص دارد، “نظریه سادهتر” الزاما به معنی نظریهای که میشود به روش سادهتری توصیف کرد نیست، بلکه به این معنای نظریهای است که اجزاء محرک کمتری دارد (تعداد متغیر کمتر در یک معادله، انواع ایده های انتزاعی کمتر، یا فرض و گمان کمتر).
این قاعده همچنین به معنای “اصل امساک” نامگذاری شده است. معنای لغوی امساک بخل یا خست است، بخیل به فردی اشاره داد که هنگام خرج کردن خیلی احتیاط به خرج میدهد. فرض کنید اگر شما میبایستی برای هر بخش از نظریهای که در حال ایجاد آن هستید، متغیرها یا فرضیه ها 250 هزار تومان پرداخت میکردید، شما مطمئنا تمام سعی خود را میکردید که فقط بابت اجزایی پول پرداخت کنید که وجود آنها ضروریست نه همه اجزا، در این شرایط قاعده تیغ اوکام برای جیب شما بسیار مهم خواهد بود. بیاد داشته باشید که قاعده تیغ اوکام، یک قاعده سرانگشتی است نه یک قانون. در بسیاری از مواد بسیار عالی عمل میکند، و دانشمندان و فلاسفه در طراحی آزمونها و استدلالها به آن تکیه میکنند، اما شما نباید آن را به عنوان قانون محکم منطقی بپذیرید! یکی از مثال های معروف این قاعده معادله مشهور انیشتن E=MC2 است. البته مراقب باشید شرط آن یعنی “ همه شواهد موجود را در بردارد” رعایت شود در غیر اینصورت در دام سادگی گرفتار میشوید. [16]
تا کنون گفتیم اگر همه چيز را يکسان کنيد، اونوقت ساده ترين توضيح، درست ترين است، اما شرایط همیشه کاملا برابر نیست، پس همیشه نمیتوان به صراحت از این قاعده در ریاضیات استفاده کرد. در جدال با این چالش، در دهه 60 میلادی آندری نیکولایویچ تیخونوف راهحلی را پیشنهاد داد: یک عبارت به محاسبهتان اضافه کنید تا پیچیدگی را جریمه کند. با معرفی این عبارت (پیشقدر استقراء) نه تنها مدل پیچیدهتر بدتر عمل نمیکند، بلکه به شکلی بهتر میتواند دادهها را با توجیه پیچیدگی خودش، تشریح کند. دانشمندان علوم کامپیوتر به این قاعده تنظیم (رگولاریزاسیون) میگویند.
یک الگوریتم در سال 1996 توسط رابرت تیبشیرانی کشف شد که به LASSO معروف است. لاسو یک مدل تنظیم شده از مدل کمترین مربعات است. در لاسو با افزایش جریمه، تعداد بسیار بیشتری از ضرایب به سمت صفر میل میکنند و فقط فاکتور هایی که تاثیر بیشتری برروی نتایج دارند در معادله باقی میمانند، مدل بیشبرارزش شده 9-فاکتور قبلی را در نظر بگیرید، با جریمه کردن پیچیدگی این معادله به یک معادله ساده و محکمتر با چند فاکتور ضروری تبدیل میشود.(لاسو در حقیقت یک اسم “تخیلی” برای نرم L1 است) [17]
تکنیک هایی مثل لاسو در حال حاضر در اکثر مدلهای یادگیری ماشین یافت میشود، اما قواعد مشابه “جریمه پیچیدگی” همچنین در طبیعت به چشم میخورد. موجودات زنده و ارگانهایشان همیشه به صورت خودکار به سمت سادگی(غیر پیچیدگی) رانده میشوند.(به لطف محدودیت زمان، حافظه، انرژی و …)
به عنوان مثال، بار سوخت و ساز در بدن به عنوان یک “ترمز” برای پیچیدگی در ارگانها عمل می کند و کالری ازدست داده شده، حکم همان ضریب پیچیدگی را دارد(همان نرم L1 خودمان در یادگیری ماشین). این واقعیت که مغز انسان حدود یک پنجم کالری مصرفی روزانه انسان را می سوزاند، نشان دهنده ی مزایای تکاملی است که توانایی های ذهنی به ما ارائه می دهد، این میزان انرژی در حقیقت همان جریمه پیچیدگیست که مغز باید بپردازد. از سوی دیگر، از دیدگاه تکاملی داشتن مغزی با پیچیدگی به مراتب بالاتر هیچ کمکی در بالارفتن راندان نمی کند. [18]
در علوم رایانه، مدلهای مبتنی بر مغز(یا حداقل یک دیدکارتونی ما نسبت به آن)، معروف به شبکه های عصبی میتوانند توابع پیچیده دلخواهی را یاد بگیرند، این شبکهها نسبت به مدل 9-فاکتور ما که قبلا درباره آن بحث کردیم بسیار انعطافپذیرتر هستند، اما به دلیل همین انعطافپذیری زیاد، آسیبپذیر هستند و میتوانند در دام بیشبرارزش گرفتار شوند. شبکههای عصبی واقعی بیولوژیکی در مغز برخی از این مشکلات را با روشهای مختلف دور میزنند. متخصصین علوم اعصاب میگویند: مغز سعی میکند که تعداد نوران های فعال شده در هر لحظه کاهش دهد، این امر تاثیری مشابه قاعده لاسو دارد، یعنی فشار برای پایین آوردن پیچیدگی. همچنین، با استفاده از اینچنین استراتژیهایی که در مغز وجود دارد (استراتژی که به کدینگ اسپارس معروف است، یکی از انواع کدگذاری عصبی است که برحسب موضع و محل قرار گیری نورون ها در برابر کدگذاری متراکم در نظر گرفته می شود. در این استراتژی، در هر لحظه، تعدادی کمی از نورونها شدیدا فعال و در حال فعالیت هستند، و بقیه خاموشند) محققین علوم رایانه شبکه های عصبی بوجود آوردند که خصوصیاتی شبیه کرتکس بینایی انسان دارند. [19]
زبان نمونه دیگری از یک نوع Lasso طبیعی است، هنگام سخن رانی و ارایه، پیچیدگی که توسط صحبت های طولانی مدت بوجود میآید با پر اتهاب شدن محدوده توجه شنوندگان، جریمه میشود. به این دلیل است که ایدههای کسب و کار در قالب سخنرانی های آسانسوری بیان میشوند (سخنرانی آسانسوری استعاره ای از یک ارتباط بسیار موثر در یک زمان کوتاه است، به این دلیل واژه آسانسور به کار برده شده که وقتی شما وارد یک آسانسور میشوید فقط 60 ثانیه وقت دارید تا ایدهتان را به کسی معرفی کنید.)
پندهای زندگی فقط زمانی تبدیل به ضربالمثلهای خردمندانه میشوند که به صورت خلاصه و جذاب درآیند،زیرا گفتهها باید از درگاه شنوایی انسان که پیچیدگی نمیپذیرد،عبور کند.
اقتصاددان هری مارکوویتز جایزه نوبل سال 1990 در اقتصاد را برای نظریه سبد سهام مدرن(بهینه سازی پورتفولیو ) یا تحلیل میانگین واریانس برد. این نظریه در واقع چارچوب ریاضیاتی برای جمعآوری سبدی از داراییها است به نحوی است که بازگشت مورد انتظار برای یک سطح ریسک داده شده که تحت عنوان واریانس تعریف میشود، حداکثر شود. [20]
وقتی به سراغ سرمایهگذاری پسانداز بازنشستگی میرویم به نظر میرسه مارکویتز بهترین استراتژی را برای خودش به کار برده است. اما ایشان دقیقا چهکاری انجام داد؟ مارکویتز میگه: من بایستی کوواریانس گذشته گروه دارایی و مرز کارا رسم شده آنها را محاسبه میکردم، در عوض، اندوهی را تصورم کردم: اگر بازار سهام رشد داشته باشد و من در آن نباشم، یا اگر بازار سهام پایین برود و من در آن حضور داشته باشم، هدف من کمینه کردن افسوس در آینده شد، در نتیجه مشارکتم را به صورت 50-50 بین اوراق قرضه و سهام تقسیم کردم. [21]
اما او چرا این کار را انجام داد؟ داستان برنده نوبل و استراتژی سرمایهگذاریش میتوانید نمونه ای از غیرمنطقی بودن انسانها باشد. (وقتی با پیچیدگی دنیای واقعی روبرو شد، مدل منطقی را رها کرد و یک مدل فرا ابتکاری ساده را دنبال کرد.) دقیقا به دلیل همین پیچیدگی دنیای واقعی است که مدل های ساده فرا ابتکاری در حقیقت ممکن است راه حل منطقی شوند. وقتی بحث مدیریت پورتفولیو(سبد سهام) به میان میاد، به نظر میرسه علارغم اینکه شما به اطلاعاتی که درباره بازار دارید بسیار مطمئن هستنید، در واقع بهتره همه اطلاعات را بیخیال شید.
بهکاربردن نظریه مدرن پرتفولیو مارکویتز مستلزم داشتن تخمین خوبی از خصوصیات آماری سرمایه گذاری های متفاوت است. یک خطا در این تخمین ها میتواند نتایج خیلی متفاوتی در تخصیص داراییها داشته باشد، که به صورت بالقوهای ریسک را افزایش میدهد، در مقابل، تقسیم کردن پولتان به صورت یکنواخت بین اوراق بهادار و سهام تحت تاثیر داده هایی که شما مشاهده کرده اید، نیست. این استراتژی حتی سعی در برارزشکردن خودش به عملکرد گذشته انواع سرمایه گذاری ها ندارد، در نتیجه هیچ راهی برای بیشبرارزش شدن وجود ندارد.
با الهام از مثال هایی مثل استراتژی پسانداز بازنشستگیِ مارکویتز، دو روانشناس گرد گینگرز و هنری برایتون استدلال کردند: میانبرهای تصمیم گیری که مردم در دنیای واقعی در بسیاری موارد به کار میگیرند، از این موضوع پیروی میکنند، برخلاف دیدگاه عمومی که پردازش کمتر، دقت را پایین میآورد این دو محقق در مقاله خود مینویسند: “مطالعه اکتشافی نشان میدهد که اطلاعات، محاسبات، و زمان کمتر در واقع میتواند دقت را افزایش دهد.” یک روش اکتشافی با فاکتورها و محاسبات کمتر، دقیقا اثرات less-is-more را دارد. Less-is-more به معنی “کمتر غنیتر است”، اصطلاحی که برای اولین بار توسط رابرت براونینگ استفاده شد. مطالب زیادی در این باره وجود دارد که میشود درباره آن بحث کرد اما از حوصله این بحث ما خارج است. [22]
بازار شیر سویا در ایالات متحده، از اواسط دهه 1990 تا سال 2013، بیش از چهار برابر الان بوده است. اما بر اساس سر تیترهای خبری، به نظر میرسد از سال 2013 به بعد، این روند تغییر یافت و شیر بادام جایگزین آن شد. همانطور که لری فینکل، پژوهشگر مواد خوراکی و آشامیدنی به بلومبرگ بیزینسویک گفته: «در حال حاضر آجیل مرسوم است و سویا بیشتر شبیه غذاهای سالم از مد افتاده به نظر میرسد.» [23]
شرکت سیلک که مشهور به عامه پسند ساختن شیر سویا است (همانطور که از نامش پیداست)، در اواخر سال 2013 گزارش داد که محصولات شیر بادامش تنها در سه ماهه اول تا بیش از 50 درصد رشد داشته اند. در همین احوال، در یکی دیگر از اخبار مربوط به مواد آشامیدنی، برند پیشتاز آب نارگیل، ویتا کوکو، در سال 2014 گزارش داد که از سال 2011 فروشش دو برابر شده و از سال 2004 تاکنون به طرز شگفتانگیزی سیصد برابر شده است. نیویورک تایمز نیز نوشت: «به نظر می رسد آب نارگیل، از حوزه ناشناخته به اجتناب ناپذیر پریده است.» [24]
در همین حین، بازار کلمپیچ تنها در سال 2013 تا %40 رشد پیدا کرد. در سال قبل از آن، بزرگترین خریدار کلمپیچ پیزا هات بود که از آن به عنوان تزئینات، در سالنهای مربوط به سالاد خود استفاده میکرد. [25]
به طرز عجیبی به نظر میرسد برخی از اساسیترین حوزههای زندگی بشری، مانند این سوال که چه موادی باید در بدن خود وارد کنیم، بیشتر تحت تأثیر مدهای زودگذر باشند. بخشی از آنچه که باعث میشود طوفان این مدها دنیا را فرا بگیرد مربوط به سرعت تغییر فرهنگ ما است. در حال حاضر، اطلاعات سریعتر از همیشه در سراسر جامعه در جریان است، و در همین حین زنجیره های عرضه جهانی، می توانند باعث شوند تا مصرف کنندگان عادات خرید خود را به کلی تغییر دهند (بازاریابی، آنها را برای این کار تشویق می کند). چنانچه مطالعه ویژهای انجام شود که مزیت سلامتیِ فرضا بادیان رامی را پیشنهاد دهد، میتواند ظرف یک هفته در تمام شبکههای اجتماعی و هفته بعد در تلویزیون و از قرار معلوم ظرف شش ماه در هر سوپر مارکتی دیده شود، و به زودی کتابهای آشپزی اختصاص یافته به بادیان رامی تمام نشریات را پر میکنند. سرعت هیجانانگیز هم نعمت و هم بلا است.
در مقابل اگر ما به مسیری بنگریم که موجودات زنده به تکامل میرسند، متوجه مسأله جذابی میشویم: تغییر به آهستگی رخ میدهد، این بدان معناست که ویژگیهای موجودات امروزی نه تنها توسط محیط زیست کنونی آنها، بلکه توسط پیشینه آنها شکل گرفته است.
برای مثال، طرح ضربدری عجیب سیستم عصبی ما (سمت چپ بدن ما توسط سمت راست مغز کنترل میشود و برعکس)، پیشینه تکاملی مهرهداران را بازتاب میکند. این پدیده که تقاطع ضربدری نامیده میشود (تقاطع اعصاب در مغز و نخاع شوکی )، در مسیر تکاملی از نقطهای برمیخیرد که بدن مهرهداران اولیه 180 درجه نسبت به سرشان چرخید؛ در حالیکه طناب عصبی بیمهرگان مانند خرچنگهای دریایی و کرمهای خاکی در سمت شکم آنهاست؛ در عوض طناب عصبی مهرهداران درامتداد ستون فقرات آنهاست.[26]
گوش انسان مثال دیگری را بیان میکند. از یک منظر کاربردی، گوش، سیستمی برای ترجمه امواج صوتی به پیامهای الکتریکی توسط تقویت آن امواج از طریق سه استخوان چکشی، سندانی و رکابی است. این سیستم تقویتی ستودنی است اما جزئیات کارکرد آن مربوط به محدودیتهای تاریخی آن است. به نظر میرسد خزندگان تنها یک استخوان در گوش خود دارند، اما استخوانهای دیگری در آرااره دارند که پستانداران فاقد آن هستند. ظاهرا این استخوانهای آرااره در پستانداران تغییر نقش یافتهاند. بنابراین شکل و پیکر بندی دقیق ساختمان گوش ما، پیشینه تکاملی ما را حداقل به اندازهای که مسأله شنیداری را حل کند، بازتاب مینماید. [27]
گرچه تارهای عصبی ضربدری و استخوانهای تغییر نقش یافته آرواره ممکن است شبیه تنظیماتی زیر حد مطلوب به نظر برسند، اما ما انتظار نداریم که تکامل لزوما با هر تغییر در کنامِ زیستمحیطی یک موجود زنده، او را به کمال مطلوب برساند. یا حداقل تشخیص میدهیم که چنین عملی او را به شدت به تغییرات زیستمحیطیِ بیشتر حساس میکند. از سوی دیگر استفاده ناگزیر از مواد موجود، نوعی محدودیت مفید را اعمال میکند. این موضوع باعث میشود محیط زیست نتواند تغییرات شدیدی را در ساختار ارگانها بوجود بیارد و احتمال بیشبرازششدن نیز کاهش پیدا میکند. وقتی که یک گونه توسط گذشته محدود میشود، باعث میشود که ما به شکل ناکاملتری با زمان حال که برای ما شناخته شده است سازگار شویم، اما به قوی نگه داشتن ما برای آیندهای که نمیشناسیم کمک میکند. یک نگرش مشابه ممکن است به ما در مقاومت در برابر مدهای با حرکت سریع در جامعه بشری کمک کند. وقتی این مدها وارد فرهنگ میشوند، “سنتها” نقش محدودیتهای تکاملی را بازی میکنند. کمی محافظهکاری، یک تعصب خاص نسبت به گذشته، میتواند ما را در برابر چرخه رونق و از رونقافتادن مدها ایمن کند. البته این به هیچ وجه به این معنا نیست که ما باید جدیدترین اطلاعات را نادیده بگیریم.
در یادگیری ماشینی، مزیتهای حرکت آهسته، در یک روش تنظیم با عنوان توقف اولیه، به طور کاملا عینی پدیدار میشود. وقتی در ابتدای مطلب به دادههای نظرسنجی ازدواج در آلمان نگاه کردیم، مستقیما سراغ بررسی مدلهای یک، دو، و نه-فاکتور با بهترین برازش رفتیم، با این حال، در بسیاری از موقعیتها، تنظیم پارامترهایی برای یافتن بهترین برازش ممکن برای دادههای معین، یک فرایند خود به خودی است. چه اتفاقی میافتد اگر ما این فرایندها را زود متوقف کنیم و این بار به یک مدل به سادگی اجازه ندهیم که بیش از حد پیچیده شود؟ باز هم چیزی که در ابتدا ممکن است خجالتآور به نظر برسد مانند مردد بودن یا ناکامل بودن، ظاهر میشود، ولی در عوض این به عنوان یک استراتژی مهم در حق خودش است.
برای نمونه، بسیاری از الگوریتمهای پیشبینی با جستجو برای مهمترین یک-فاکتور به جای پریدن به مدل چند فاکتوره شکل میگیرند. آنها تنها پس از یافتن آن فاکتور اول، به دنبال مهمترین فاکتور بعدی برای افزودن به مدل میگردند، سپس فاکتور بعدی و به همین ترتیب. بنابراین، مدل میتواند قبل از آنکه بیشبرازش فرصت رخنه کردن در آن را پیدا کند، با توقف فرایند به طور کوتاه مدت، به سادگی از پیچیدگی کامل حفظ شود.
این نوع از موارد “جایی که زمان بیشتر به معنی پیچیدگی بیشتر است”، نشان دهنده بسیاری از تلاشهای بشری است. صرف زمان بیشتر برای تصمیمگیری درباره چیزی، الزاما به این معنی نیست که تصمیم بهتری خواهید گرفت، اما تضمین میکند که به در نظر گرفتن فاکتورهای بیشتر، فرضیات بیشتر، مزایا و معایب بیشتر، خطر بیشبرازش بیشتر خواهد شد.
زمانی که تام استاد شد دقیقا این تجربه را داشت. ترم اول که در حال تدریس اولین کلاسش بود، وقت زیادی را صرف تکمیل سخنرانی خود کرد (بیش از ده ساعت آمادهسازی برای هر ساعت از کلاس). ترم دوم به طور متفاوتی تدریس کرد. او قادر نبود زمان زیادی را صرف کند و میترسید که این به یک فاجعه تبدیل شود. اما یک اتفاق عجیب افتاد: دانشآموزان کلاس جدید او را دوست داشتند. در واقع آنها این کلاس را بیشتر از اولی دوست داشتند. به نظر میرسید آن ساعتهای اضافهای که صرف جمع آوری جزییات بیشازحد میشد تنها دانشآموزان را گیج میکرد و منتهی به زده شدن آنها از سخنرانیهای دفعه بعد تام هنگام تدریس در کلاس میشد. مسأله مهمی که تام سرانجام آن را دریافت این بود که او سلیقه و قضاوت خودش را به عنوان نوعی معیار اندازهگیری برای دانش آموزانش استفاده میکرده است.
تأثیر “تنظیم” در تمام نقشهای یادگیری ماشینی نشان میدهد که ما میتوانیم با تفکر سنجیده و کار کمتر تصمیمهای بهتری بگیریم. اگر فاکتورهایی که ما ابتدا طراحی میکنیم احتمالا مهمترین آنها باشند، بنابراین، ورای یک نقطه خاص، تفکرِ بیشتر در مورد یک مسأله، نه تنها هدر دادن وقت و انرژی نیست بلکه ما را به راه حلهای بدتر هدایت میکند. اما تبدیل این مسأله به یک توصیه عملی نیازمند پاسخ به یک سؤال دیگر است: ما چه زمانی باید تفکر را متوقف کنیم؟
برسیم به جمله اول، چه وقت کمتر فکر کنیم؟
با تمام مشکلاتی که بیشبرارزش به وجود میآورد، اینکه چقدر زود توقف کنیم وابسته به شکاف بین چیزی که میتوان اندازهگیری کرد و چیزی که واقعا اهمیت دارد، است. اگر همه حقایق را دارید و آنها عاری از خطا و عدم قطعیت هستند و از طرفی میتوانید مستقیما آن چیزی را که برای شما اهمیت دارد را ارزیابی کنید، پس زود توقف نکنید، طولانی و سخت فکر کنید: پیچیدگی و تقلا قابل تقدیر هستند. [28]
اما تقریبا هیچ وقت اینگونه نیست، اگر همه چیزی که شما دارید عدم قطعیت و داده محدود است، پس زود توقف(stop early) کنید. هر چه عدم اطمینان بیشتر باشد، فاصله بین آنچه می توانید اندازه گیری کنید آنچه مهم است بیشتر میشود و باید مراقب بیشبرارزش باشید. هرچه خواهان سادگی بیشتر هستید باید زودتر توقف کنید.
وقتی که واقعا در تاریکی قرارگرفته اید، بهترین نقشهحسابشده، ساده ترین آنهاست. وقتی انتظارات ما غیرقطعی و داده ها سرشار از نویز هستند کلینگر باشید و به اصل موضوع فکر کنید.
به قول جیسون فرید و داوید هانمن هانسون که در کتاب بازنگری خودشون میگوید:
هنگامی که شروع به طراحی چیزی میکنیم، ما ایده ها را به جای طراحی کردن با یک خودکارنوکساچمهای (همان خودکار عامه خودمان) با یک مارکر(ماژیک) ضخیمنوک طراحی میکنیم. چرا؟ چون خودکار خیلی ظریف است و وضوح بالایی دارند. این موارد،تشنجی را در شما بوجود میآورد که نگران چیزهایی باشید که هنوز اهمیت ندارند، مثل: تکمیل کردن سایه گذاری یا اینکه از نقطه چین استفاده کنید یا نه. در نهایت، بیشتر تمرکز شما روی مواردی خواهد بود که هنوز اهمیت ندارند. در عوض وقتی از یک مارکر ضخیمنوک استفاده میکنید، امکان رسم جزییات را ندارید، فقط میتوانید خطوط و اشکال ساده ای را رسم کنید، این خیلی خوب است. تصویر کلی همه چیزی است که شما باید در شروع روی آن تمرکز کنید.
برگردیم به مسئله ازدواج داروین، مسئله داروین”اینکه آیا پیشنهاد ازدواج دهد یا خیر” شاید میتوانست با در نظر همان دو سه نقاط مثبت و منفی اولیه حل شود، موارد بعدی، حاصلی جزء وارد کردن اضطراب، اتلاف وقت و تاثیر چندانی در تصمیم نهایی نداشتند از طرفی هیچ کمکی به شفاف شدن پروسه تصمیم گیری نکردند.
چیزی که شاید به ذهن داروین خطور کرد این بود “غیرقابل تحمله که یک عمر را مثل یک زنبور کارگر کار کنم و در نهایت به چیزی نرسم” همان دو مورد اول یعنی فرزندان و همراهی موارد اساسی بودند که او را تشویق به ازدواج کرد، موراد دیگر مثل بودجه کتابش بیشتر شبیه آشفتگی بودند.
داروین مثل فرانکلین نبود که چندین روز وقت بگذارد و لیست بلند بالایی از این موارد را در دفترچه روزانهاش یاداشت کند. علارغم تصمیم مهمش که زندگیش را تغییر میداد، داروین تصمیش را دقیقا هنگامی گرفت که به انتهای صفحه رسید. این داستان دقیقا یادآور دو مفهوم “توقف زودهنگام” و “لاسو” است. وقتی داروین تصمیم به ازدواج گرفت در صفحه بعد دوباره لیستی از نقاط منفی و مثبت رفتن به ولز نوشت اما همینطور که به پایان صفحه رسید نوشت “ مهم نیست، شانست را امتحان کن”. بعد از چند ماه این دو با هم ازدواج کردند که شروع یک زندگی سرشار از شادی و همنشینی بود.آیا تا به حال در زندگی روزمره تان درگیر بیشبرارزش شده اید؟ چگونه؟ در ابتدای پست از کش مکش من با معلم سخن گفتمبه نظر شما آیا این شیوه توضیح دادن مفاهیم کمک به سیال شدن هر چه بیشتر ذهن دانش آموزان نمیکند؟
منابع
(1)The Correspondence of Charles Darwin, Volume 2: 1837-1843
(2)From Benjamin Franklin to Joseph Priestley, 19 September 1772
(3)Reexamining adaptation and the set point model of happiness: Reactions to changes in marital status.
(4)Thou shalt not make unto thee any graven image
(5)Kings 18:4
(6) Stumbling on Happiness by Daniel Gilbert
(7) Epee 2.0: The Birth Of The New Fencing Paradigm
(10)5 Avinash Kaushik blogs every digital marketer should read
(11)How to Use a Shooting Range
(13)Training Scars
(14)Too many teachers ‘teaching to the test’
(15) Canaries in the Coal Mines
(16) Occam’s Razor
(17)Reading the Lasso 1996 paper by Robert Tibshirani
(18)The Circulation and Energy Metabolism of the Brain
(19)Emergence of simple-cell receptive field properties by learning a sparse code for natural images
(20)Portfolio Selection: Efficient Diversification of Investments
(21) I split my contributions fifty-fifty b
(22)Homo Heuristicus: Less-is-More Effects in Adaptive Cognition
(23)Soy Milk Fades as Americans Opt for Drinkable Almonds
(25)Sales of kale soar as celebrity chefs highlight health benefits
(26)Ask a Neuroscientist: Why does the nervous system decussate?
(27)Homology: From jaws to ears — an unusual example of a homology