Зараз в українському сегменті інтернету розгорнулася гаряча дискусія на тему Штучного Інтелекту. Коротко, дехто демонстративно відмовився від використання створених ШІ зображень у своїй праці і понеслася.
“Противники” ШІ говорять про неетичність використання створених машиною праць і загалом доволі конструктивно відстоюють свою позицію. Авторам треба заробляти на життя і ми даємо їм таку можливість. Використання чужих праць при створенні нових без згоди автора є неетичним вчинком.
“Прихильники” ШІ переважно акцентуються на тому, що прогрес не зупинити і звинувачують “противників” ледь не у луддизмі, лівацтві, інфантильності і т.д.
З обох сторін лунають почасти розумні аргументи, але загальний тон дискусії наводить на думки, що в цілому люди не розуміються на проблемі ШІ і тому, які виклики він створює, а також, що підтримка ШІ базується не на аналізі реальної ситуації в області, а на вірі. Святій вірі в прогрес, який не зупинити.
Безумовно, ШІ є дуже корисним винаходом, і він суттєво підвищує продуктивність в багатьох областях. Тільки робить це він тоді, коли машина не замінює людину, а співпрацює з нею. Замість повністю відібрати працю у людини ШІ змінить якість цієї праці – ми всі станемо спеціалістами в ШІ в тій або іншій мірі. Це абсолютно нормально і такі зміни об’єктивно принесуть користь людству, якщо них правильно контролювати.
Проблема 1. Неконтрольований ШІ.
Підхід дикого ринку у ситуації з ШІ, який парадоксальним чином дуже популярний в соціально-орієнтованій Україні, може призвести до трагічних наслідків.
“Прихильники” ШІ згадують луддитів? Я пропоную відкрити наступну сторінку підручників і згадати повстання пролетаріату. Якби свого часу держави подбали про інтереси простих людей, то людство могло б уникнути Карла Маркса і натхненних ним трагедій з мільйонними жертвами. Якщо зараз ви готові на все заради технічного прогресу, то уявіть, що завтра ваша праця коштуватиме копійки і ви елементарно не зможете прогодувати родину. Натомість хазяї бізнесу, побудованому на ШІ, будуть отримувати надприбутки.
Технічний прогрес, частиною якого є ШІ, повинен працювати на користь людства, а не навпаки. Якщо він використання ШІ значно більше людей програє, ніж виграє, то навіщо такий ШІ?
Проблема 2. Авторські права.
ШІ тільки частково складається з нової технології. Сама технологія теж небезкоштовна і зазвичай запатентована, але її кошт все одно ніщо в порівнянні з коштом даних. Можна ще згадати процес тренування, який вимагає ресурсів, які теж коштують чимало, але з цим, принаймні, все зрозуміло – маєш бабки, можеш тренувати. Питання – на яких даних ти це будеш робити?
Можна брати дані з відкритих джерел (українці, підозрюю, хибно уявляють, що їх цілком вистачить для якісного тренування), але для доброго результату потрібно більше. Потрібні перевірені джерела, які мають своїх авторів, не ноунеймів. Наприклад, друковані книги. Щоби якісно натренувати ШІ потрібно мільйони книг, часто-густо вузької спеціалізації. А ви знаєте скільки на Заході коштують книги вузької спеціалізації? Мільйони книг легко можуть перетворитись на мільярди доларів. За умови якщо ви їх офіційно купили і ліцензія користування дозволяє використовувати їх для машинного навчання.
Машинне навчання – зовсім не те саме, що людське навчання. Аргумент, що часто лунає, на користь безоплатності використання захищених правом власності джерел говорить, що людина вчиться на чужих джерелах і машина робить те ж саме. Ок. Залишається перше питання про кошт джерел: людина платить в книгарні за кожну книгу, не впевнений, що умовний ChatGPT заплатив за кожне використане для свого тренування джерело (мільярди баксів і все таке).
А далі постає питання процесу машинного навчання. Він настільки несхожий на людське навчання, і настільки схожий на процес копіювання (тільки не дослівно, а параметрично), що виникають серйозні сумніви в раціональності порівняння машинного і людського навчання.
Окрім того, свої отримані знання людина не використовуватиме для відтворення того, що було в підручнику. В процесі навчання вона повинна навчитись створювати принципово нові речі, і саме цим в майбутньому заробляти на життя. Уявіть, що людина вивчила всі картини Ван Ґоґа і продає їхні репродукції. Очевидне порушення прав власності.
Машинне навчання можна назвати “машинною переробкою” і тоді легше знайти аналогії в житті. Наприклад, в музичній галузі переробка твору тягне за собою вимогу додавання авторів оригінального твору до списку авторів переробки. Наприклад, пісня Тейлор Свіфт “Look What You Made Me Do” серед авторів налічує творців пісні “I’m Too Sexy”, яка була використана для створення нового твору. За цим принципом, будь-який машинний текст повинен бути підписаний мільйонами авторів, чиї тексти були вжиті для тренування.
Проблема 3. Упередженість.
Про це говорять найменше, але машинне навчання діє за принципом “сміття на вході, сміття на виході”. Якщо ви не хочете платити за якісні тексти, то вам залишаються тексти з інтернету невідомої якості. Опускаючи те, що їхні автори теж можуть висувати правові претензії до творців моделей, залишається питання наповнення цих текстів. Відсутність нормальної фільтрації російської пропаганди в Твіттер призвела до сповзання цієї соц-мережі у прірву. А тепер уявіть тексти, згенеровані на підставі цих твітів.
Якщо ви не хочете, щоб ваша модель продукувала расистські, ксенофобні, гомофобні тексти, то вам доведеться фільтрувати вхідні дані. Якщо ви хочете, щоб ваш машинний генератор коду підказував адекватні рішення, вам доведеться усувати спагетті-код з тренувального набору даних.
Ну а якщо вільний ринок для вас значить більше, ніж неупередженість думок, то приготуйтесь на те, що більшість текстів будуть захищати російський геноцид в Україні – росія має більше грошей і генерує більше текстів, на яких може вчитись ШІ.
Підсумок.
Штучний Інтелект безумовно корисний винахід. Він може суттєво покращити якість життя людини. Але якщо його не контролювати, то він може навпаки зробити життя значно гіршим, спровокувати появу чергового Карла Маркса, а також мати ефект ядерної бомби. Ми повинні дуже обережно аналізувати кожен крок в розвитку ШІ, а не сліпо захищати винахід, про який самі ще мало чого знаєм.