Чей это текст, Линуса или Грега?

Автор: admin от 29-12-2017, 21:45, посмотрело: 40

Праздник к нам приходит, все труднее писать и даже читать про планировщики и алгоритмы. Благо в мире открытого ПО есть и более отвлеченные темы. Почему бы например не сравнить стиль деловой переписки Линуса Торвальдса и Грега Кроа-Хартмана?



Чей это текст, Линуса или Грега?



Предлагаю читателям Хабра поупражняться в физиогномике и задаться вопросом, с кем бы из двух командиров проекта Linux ядра вы бы предпочли обсуждать прогресс вашего патча?

































ПараметрыЛинус ТорвальдсГрег Кроа-Хартман
Временной интервал1995–20151995–2015
Количество емайлов21,74624,145
Количество слов в емайле13253
Лексическое разнообразие.08.27


Предупреждение, под катом ненормативная лексика на английском языке, использованная в контексте деловой переписки и научного исследования.

Linux Foundation. ГКХ присущи фантастическая продуктивность и работоспособность, фраза maintainers don't scale к нему имеет лишь условное отношение.



Трое ученых их Университета Элон в Северной Каролине Соединенных Штатов Америки, провели исследование переписки Линуса Торвальдса и Грега Кроа-Хартмана, взяв архив LKML за 20 лет с 1995 по 2015 гг. Целью было исследование стилей переписки двух руководителей проекта и методом машинного обучения научиться различать их тексты.



Для тех, кто в теме не секрет, что Линус Торвальдс, будучи вполне дружелюбным и обаятельным в реальной жизни, практикует довольно жесткий и бескомпромиссный стиль в деловой переписке с разработчиками ядра. В связи с эти обстоятельством, он неоднократно становился объектом критики со стороны приверженцев более строгих стандартов деловой этики.



За примерами далеко ходить не надо. Недавно на орехи досталось Kees Cook-у — программисту из команды Google Pixel, который пытался протащить обновления безопасности, которые могли иметь негативные последствия для ПО в пользовательском пространстве. Чертовы кретины (f**ing morons), так Линус охарактеризовал специалистов в области безопасности в лице настойчивого разработчика из Гугл.



Страсти вокруг SecureBoot и правил хорошего тона



В июле 2013 г. из проекта ушли Мэтью Гарретт и Сара Шарп. Честно говоря потеря была невелика и чрезмерная готовность Метью идти навстречу интересам крупных корпораций неоднократно вызывало вопросы. Сама же Сара в своем блоге демонстрирует явно не тот стиль общения, который желает видеть по отношению к себе.



As this is my blog, not a government entity, I have the right to replace any comment I feel like with “fart fart fart fart" © Sarah Sharp

И все же я не уверен, что даже более толстокожие разработчики могли бы выдержать то, что Линус высказал Мэтью по поводу патчей, которые должны были обеспечить загрузку Linux на рабочих станциях, изготовленных под Windows 8+ и использующих UEFI с технологией SecureBoot.



Guys, this is not a dick-sucking contest.

Далее лидер проекта излагал свою точку зрения о том, что такие прогибы под Microsoft неуместны со стороны разработчиков кернела, а RedHat и другие вендоры вольны делать то, что им вздумается. В целом эта переписка была слишком экспрессивной даже для LKML, и Гарретт решил, что с него хватит.



В ходе этого спора Линус подзуживал ГКХ в духе: «соберись уже и хватит быть тряпкой», еще один из ключевых мейнтейнеров Инго Мольнар высказывал ему то же самое, утверждая, что иногда разработчиков можно и послать по известному адресу.



Склоки продолжались какое-то время, а затем участники проекта договорились о том, что нужен некий общий свод правил хорошего тона, что и было документально зафиксировано в /usr/src/linux/Documentation/CodingStyle



Автороведческая экспертиза Линуса и Грега



Исследование проводилось методом НЛП известным, как Naive Bayes Classifier с использованием «мешка слов» (bag-of-words). Для определения частей речи использовалась библиотека Python NLTK. Симуляция методом Монте-Карло показала хорошие прогностические способности установить авторство текста с помощью данного алгоритма машинного обучения. Как утверждают авторы исследования точность прогноза достигает 97%.



Приведенная ниже таблица использования ненормативной лексики английского языка думаю не нуждается в комментариях.



















































































ЛексикаЛинусГрег
Всего3090150
crap1204107
hell72522
damn6822
shit1261
anal540
bullshit502
ass466
god341
screw330
bastard290
bitch170
piss174
retard140


Тренировочная таблица для алгоритма машинного обучения так же говорит сама за себя.



Чей это текст, Линуса или Грега?



Исследование учитывает лишь словарный запас английского языка, что исключает элементы финского фольклора, как этот.



There aren't enough swear-words in the English language, so now I'll have to call you perkeleen vittupaa just to express my disgust and frustration with this crap.

Как видно из исследования создатель Linux гораздо охотнее прибегает к ненормативной лексике и гораздо реже бывает изысканно учтив и тем не менее я считаю, что чувство меры до сих пор ему не изменяло, и его жесткость не переходило ту черту, за которой начинается самодурство. А что думают по этому поводу читатели?



Источник: Хабрахабр

Категория: Операционные системы » Linux

Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь.
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.

Добавление комментария

Имя:*
E-Mail:
Комментарий:
Полужирный Наклонный текст Подчеркнутый текст Зачеркнутый текст | Выравнивание по левому краю По центру Выравнивание по правому краю | Вставка смайликов Выбор цвета | Скрытый текст Вставка цитаты Преобразовать выбранный текст из транслитерации в кириллицу Вставка спойлера
Введите два слова, показанных на изображении: *