Системи штучного інтелекту для створення зображень

Оскільки ми живемо в епоху штучного інтелекту, то варто знати як він влаштований, хоча б для того, щоб не думати, що повстання машин, як в фільмі «Термінатор», вже на обрії. Нажаль, люди ще не настільки добре знаються на цій темі, щоб створювати штучний мозок, і на щастя, всі нинішні винаходи в цій області цілком контрольовані людиною.

Будь-які системи подібного типу працюють за однаковим сценарієм. Спочатку їх треба навчити створювати певний продукт – в нашому випадку зображення. Відбувається навчання за допомоги зображень, які система вивчає і вчиться створювати подібні. Якщо під час навчання їм показувати тільки картини Леся Подерв’янського, то вони навчаться малювати в стилі Леся Подерв’янського. Якщо показувати тільки фотографії дикої природи, то на виході вони зможуть видавати зображення дикої природи. Якщо ж її вчити на зображеннях різного гатунку, то результат буде схожий на суміш вхідних гатунків. Такі системи здатні створювати випадкові зображення в заданому стилі або стилізувати вхідні зображення. Напевно фанати Ван Гога були б раді побачити фотографії із сімейного альбому перетворені на картини в стилі «Зоряної ночі» або «Соняшників».

Але можна ускладнити задачу – створити систему, яка буде не просто створювати зображення в зрозумілому їй стилі, а створювати зображення за вхідним описом. Тобто, ви можете попросити систему намалювати в стилі Леся Подерв’янського або Олександра Ройтбурда козака на бронтозаврі, що збиває із HIMARS летючу труну орків, і вона вас зрозуміє.

Щоб це сталося кожне вхідне зображення треба доповнити описом, з якого система дізнається що ньому намальовано. Так само як в музеї ви можете прочитати хто є автором картини, в якому році вона була намальована і що на ній зображено, і в майбутньому доволі точно вгадувати автора і рік створення картини, так і система може використати цю інформацію для створення власних шедеврів.

Читати: "Індіана Джонс і 40 миль на велосипеді"

Скільки треба зображень щоб система навчилася точно виконувати людські запити?

Дуже багато. Мільйони чи навіть десятки мільйонів. Все тому, що база знань системи повинна бути достатньо великою для розуміння опису, який ви їй передаєте. А кожне слово повинно бути представлене не одним, а сотнями і тисячами зображень. Уявіть, що ви прохаєте систему намалювати коня, а серед вхідних зображень була тільки одна картина підписана словом «кінь». Тоді всі нові зображення коня будуть схожі на неї. Щоб цього не сталося, вам треба показати системі багато різних зображень коней. Тільки тоді можна розраховувати на пристойний різноманітний результат.

Чи може кожний охочий створити власну систему для створення зображень улюбленої тематики?

Як класно було б одним натиском кнопки створювати зображення в стилі Марії Примаченко або Никифора Дровняка. Нажаль, для пересічної людини це недоступно через величезні потужності необхідні для тренування системи. Йдеться навіть не про один потужний комп’ютер, а десятки. Мало хто може собі дозволити таку радість, а хто може скоріше скористається ними для майнінга біткоїнів. До того ж для досягнення пристойного результату параметри системи треба підлаштовувати, що на практиці виливається в декілька десятків циклів тренування. Коротше, це дуже дороге задоволення. Тому зараз ми можемо тільки користуватися вже навченими системами, якими нам дозволили користуватися їхні творці.

Залишити коментар Скасувати відповідь