Науковцям довелося перейменувати 27 людських генів. У всьому винен Microsoft Excel (але проблема набагато глибша)

Комітет номенклатури генів (HGNC) протягом останнього року змінив позначення 27 людських генів. Зробили це тому, що в табличному процесорі Microsoft Excel ці позначення помилково переводилися в дати, що призводило до помилок в обчисленнях.

Про це повідомляє The Verge.

Excel — це табличний процесор пакету Microsoft Office, який використовується, зокрема, й науковцями для своєї роботи й навіть проведення клінічних випробувань. Але оскільки Excel був створений для більш посередніх завдань, то він не розрізняє позначення генів і скорочений формат написання дати.

Так, скорочене позначення гена MARCH1 («Membrane Associated Ring-CH-Type Finger 1») табличний процесор перетворював у 1-Mar («1 березня»). Загалом же через таке автоматичне форматування типу даних приблизно 20% досліджень можуть містити помилки в розрахунках, підрахували в 2016 році.

Excel не має опції вимкнення автоматичного форматування типу даних, тож єдиний спосіб виправити його — робити це вручну для кожної колонки. Але якщо документ відкрити на іншому пристрої, там автоматичне форматування ввімкнеться знову — а отже, знову виникнуть помилки.

Зрештою, науковці вирішили, що набагато простіше просто перейменувати гени, аніж вручну боротися з Excel. Як розповіла The Verge координаторка HGNC Елспет Брафорд, це вперше Комітету довелося перейменовувати гени через проблеми, викликані програмним забезпеченням.

А що каже Microsoft?

У Microsoft на запит The Verge не відповіли. Але є принаймні одна переконлива причина, чому компанія не змінила б свої налаштування в Excel на прохання генетиків — зворотна сумісність («backwards compatibility»). Якщо спрощено, це вимога до програмного й апаратного забезпечення підтримувати функції та особливості, що були в його попередніх версіях.

Саме тому, до речі, ви не можете назвати у Windows теку іменем «con» (спробуйте, у вас не вийде!) А річ у тім, що таку назву мала одна функція в прабатьку Windows — MS-DOS, яка запускала введення даних із клавіатури.

До речі, саме через зворотну сумісність з Excel пов'язаний ще один баг. Там присутня дата «29 лютого 1900 року», хоча 1900 рік не є високосним. Утім у найпершій версії Excel, яка вийшла в 1997 році, цю дату помилково додали — і тепер розробники не можуть виправити помилку, оскільки це суперечить стандарту зворотної сумісності.