"Ако си на 33 години и няколко пъти подред си се появявал без приятелка на Деня на благодарността, е много вероятно да бъде повдигната темата за твоя избор на спътник в живота. И абсолютно всеки ще изрази мнение.
– На Сет му трябва някое момиче, лудо като него – казва сестра ми.
– Ти си луда! Трябва му нормално момиче, за да го уравновесява – парира я брат ми.
– Сет не е луд – обажда се майка ми.
– Ти си луда! Естествено, че е луд – намесва се баща ми.
Внезапно проговаря сдържаната ми баба с тихия си глас, останала смълчана през цялата вечеря. Силните, агресивни нюйоркски гласове секват и всички очи се насочват към дребната старица с къса жълта коса и с все още доловим източноевропейски акцент. "Сет, трябва ти мило момиче. Не прекалено красива. Много умна. Да я бива с хората. Да е общителна, за да се занимавате с повече неща. С чувство за хумор, защото ти си забавен."
Защо съветите на тази възрастна жена предизвикват такова внимание и уважение в семейството ми? Първо, 88-годишната ми баба е видяла повече от всеки друг, седящ около тази маса. Наблюдавала е повече бракове от тях – много успешни, но и много неуспешни. А през десетилетията си е съставила каталог на качествата, необходими за успешна връзка. На трапезата по случай Деня на благодарността баба ми има достъп до най-голям брой "единици на наблюдение" по този въпрос. Баба ми е големите данни.
В тази книга искам да развенчая мита около науката за данните. Независимо дали ви харесва, или не, те играят все по-важна роля в живота на всички нас – и тя тепърва ще расте. Вестниците вече имат цели раздели, посветени на данните. Компаниите имат екипи, натоварени изключително със задачата да анализират данните им. Инвеститорите наливат десетки милиони долари в стартиращи компании, ако те могат да съхраняват повече данни. Дори ако никога не сте учили как да направите регресионен анализ или да изчислите доверителен интервал, ще срещнете много данни – в страниците, които четете, на бизнес събранията, на които присъствате, в клюките, които слушате край диспенсъра за вода в офиса.
Много хора се тревожат от този развой на събитията. Те се плашат от данните, лесно се губят и се объркват в един свят на числа. Смятат, че количественото разбиране на света не е за тях, а само за избраните малцина гении със силно развито ляво мозъчно полукълбо. Веднага щом се сблъскат с числа, те са готови да обърнат страницата, да сложат край на събранието или да сменят темата на разговора.
Но аз съм прекарал десет години в бизнеса с данните и съм имал късмета да работя с много от най-добрите специалисти в областта. И един от най-важните уроци, които съм научил, е: добрата наука за данните не е толкова сложна, колкото си мислят хората. Всъщност е изненадващо интуитивна.
Кое прави науката за данните интуитивна? По същество задачата й е да открива модели и да прогнозира как една променлива ще повлияе на друга. Хората правят това постоянно.
Само се замислете по какъв начин баба ми ми даде любовен съвет. Тя се опря на голямата база данни за връзките, натрупана в мозъка ѝ за почти век живот – от разказите, които е слушала от близки, приятели и познати. Ограничи анализа си до извадка от връзки, при които мъжът притежава много от моите качества – чувствителен темперамент, склонност към уединение, чувство за хумор. Съсредоточи вниманието си върху ключовите качества на жената – доколко е мила, умна, красива. Съотнесе ги с едно ключово качество на връзката – дали е пълноценна. И накрая съобщи получения резултат. С други думи, тя откри моделите и предсказа как една променлива ще повлияе на друга. Баба е специалист по обработка и анализ на данни.
Ти също си такъв. Като дете си забелязал, че ако плачеш, мама ти обръща внимание. Това е наука за данните. Като зрял човек си забелязал, че ако се оплакваш твърде много, хората по-рядко искат да прекарват време с теб. Това също е наука за данните. Забелязал си и че щом хората по-рядко желаят да прекарват време с теб, си по-малко щастлив. Когато си по-малко щастлив, си по-малко дружелюбен. Когато си по-малко дружелюбен, хората още по-малко биха желали да прекарват време с теб. Наука за данните. Наука за данните. Наука за данните.
Тъй като науката за данните е нещо толкова естествено, съм установил, че най-добрите проучвания на големите данни са разбираеми за почти всеки умен човек. Ако не можете да проумеете някое проучване, проблемът вероятно е в него, а не във вас."
Из книгата