Вече всеки може да създава приложения, които използват DALL-E 2 за създаване на изображения • TechCrunch

след дълго чакане, DALL-E 2Това е AI система за генериране на изображения на OpenAI, достъпна като API, което означава, че разработчиците могат да вградят системата в своите приложения, уебсайтове и услуги. В днешната публикация в блога OpenAI обяви, че всеки разработчик може да започне да използва силата на DALL-E 2 – сега се използва от повече от три милиона души за създаване на повече от четири милиона изображения на ден – след като създаде OpenAI API акаунт като част от публична бета версия.

Цената на DALL-E 2 API варира в зависимост от резолюцията. За 1024 x 1024 изображения цената е $0,02 на изображение; 512 x 512 снимки – $0,018 на снимка; А 256 x 256 изображения струва $0,016 на изображение. Отстъпките за обем са достъпни за компании, работещи с екипа на OpenAI Foundation.

Както при DALL-E 2 бета, API ще позволи на потребителите да създават нови изображения от текстови подкани (например „Пухкав заек, подскачащ през поле с цветя“) или да редактират съществуващи изображения. Microsoft, близък партньор на OpenAI, работи по него в Bing и Microsoft Edge с създател на снимки Което позволява на потребителите да създават изображения, ако уеб резултатите не връщат това, което търсят. Приложението за моден дизайн CALA използва DALL-E 2 API на инструмента, който позволява на клиентите да прецизират идеите за дизайн от текстови описания или изображения, докато стартиращата компания за снимки Mixtiles го включва в потока на създаване на произведения на изкуството на своите потребители.

Няма много промени по отношение на политиката с пускането на API, което вероятно ще разочарова тези, които се страхуват, че генеративни AI системи като DALL-E 2 ще бъдат пуснати без достатъчно внимание на етичните и правни проблеми, които повдигат. Както и преди, потребителите са обвързани от Общите условия на OpenAI, които забраняват използването на DALL-E 2 за създаване на насилствено, сексуално или насаждащо омраза съдържание. OpenAI също така продължава да не позволява на потребителите да качват изображения на хора без тяхното съгласие или изображения, върху които нямат права, като използва комбинация от автоматизирани и човешки системи за наблюдение, за да наложи това.

Една малка промяна е, че изображенията, генерирани с помощта на API, няма да се изисква да съдържат воден знак. OpenAI въведе воден знак по време на DALL-E 2 бета като начин за обозначаване на изображения, произхождащи от системата, но избра да го направи по избор с пускането на API.

„Насърчаваме разработчиците да разкрият, че изображенията са генерирани от AI, но не изискват подписът на DALL-E 2 да бъде включен“, каза Люк Милър, продуктов мениджър в OpenAI, който наблюдава разработката на DALL-E 2, каза пред TechCrunch чрез имейл.

Инструмент Microsoft Designer, захранван от DALL-E API 2.

OpenAI също така използва филтри Quick и Image level с DALL-E 2, макар и филтрите, от които някои клиенти се оплакват. прекалено ревностен И на неточно. Компанията е съсредоточила част от изследователските си усилия върху разнообразяване на типовете изображения, които DALL-E 2 произвежда, с цел да се бори с пристрастията, на които е известно, че стават жертва AI системите за преобразуване на текст в изображение (например създаване изображения в предимно бели мъже, когато бъдете подканени).с текст като „Примери за изпълнителни директори“).

Но тези стъпки не успокоиха всички критици. През август, Getty Images забранен Качвайте и продавайте илюстрации, създадени с DALL-E 2 и други подобни инструменти, следвайки подобни резолюции от сайтове, включително Newgrounds, PurplePort и FurAffinity. Изпълнителният директор на Getty Images Крейг Питърс каза пред The ​​Verge, че забраната е предизвикана от опасения относно „правилните неадресирани проблеми“, тъй като наборите от данни за обучение за системи като DALL-E 2 съдържат Изображения, защитени с авторски права от мрежата.

Много критици казват, че това не е просто нарушение на Бизнес със запазена марка Което поражда тяхната загриженост за DALL-E 2. Системата застрашава прехраната на артисти, чиито модели вече могат да се повтарят с няколко низа от скриптове, казват те, включително артисти, които не са се съгласили работата им да се използва за обучение по DALL-E 2 . (За да бъдем честни към OpenAI, компанията тя има Той е лицензирал част от изображенията в обучителния набор от данни на DALL-E 2, което е повече, отколкото може да се каже за някои от неговите конкуренти.)

Опитвайки се да намеря компромис, конкурсът на Getty Images Shutterstock наскоро обявявам Той ще започне да използва DALL-E 2 за създаване на съдържание, но в същото време ще стартира „фонд за сътрудници“, за да компенсира създателите, когато компанията продава работа за обучение на AI системи за конвертиране на текст в изображения. Той също така блокира произведения на изкуствен интелект, качени от трети страни, за да намали възможността произведения, защитени с авторски права, да си проправят път към платформата.

Техниците Мат Драйхърст и Холи Херндън ръководят усилие, наречено Източник + За да се позволи на хората да не позволяват тяхната работа или други подобни да бъдат използвани за целите на обучението на AI. Но е доброволно. OpenAI не е казал дали ще участва – или наистина, дали ще предложи инструмент за самообслужване, който да позволи на притежателите на права да изключат работата си от обучение или създаване на съдържание.

Mixtiles DALL-E 2 API

Mixtiles е сред първите, които възприеха DALL-E 2 API.

В интервю Милър разкри малко по отношение на подробностите за новите смекчаващи мерки, освен че OpenAI подобрява своите технологии, за да предотврати създаването на предубедено, токсично и по друг начин обидно съдържание, което клиентите могат да намерят за нежелателно. Той описа отворената бета версия на API като „итеративен“ процес, такъв, който ще включва работа с „потребители и артисти“ през следващите няколко месеца, докато OpenAI разширява инфраструктурата за работа с DALL-E 2.

Разбира се, ако бета DALL-E 2 е някаква индикация, API ще го направи се развиват с времето. В началото OpenAI деактивира възможността за редактиране на лица на хора с DALL-E 2, но по-късно може би Способност след подобряване на системата за безопасност.

„Ние свършихме много работа по този аспект на нещата – с изображенията, които качвате, и претенциите, които изпращате, доколкото нашата политика за съдържанието се вписва и печене в различни смекчаващи мерки за филтриране както на място, така и на ниво изображение, за да направим така че, например, ако някой качи изображение, което съдържа символи на омраза или е кърваво – като например съдържание с много, много насилие – това ще бъде отхвърлено“, каза Милър. „Ние винаги мислим как да подобрим системата.“

Но докато OpenAI изглежда силно желае да избегне противоречията около Stable Diffusion, еквивалентът с отворен код на DALL-E 2, който беше използван за създаване на порноИ на несправедливост И на Deepfakes на знаменитостиОставя се на потребителите на API да изберат точно как и къде да разположат своята технология. Някои, като Microsoft, несъмнено ще възприемат изчислен подход, бавно пускайки продукти, захранвани от DALL-E 2, за да съберат обратна връзка. Други ще се гмурнат с главата напред, прегръщайки както технологията, така и Етични дилеми които идват с него.

Ако едно нещо е сигурно, то е, че има задържано търсене на генеративен ИИ – последствията са проклети. Дори преди API да бъде официално достъпен, разработчиците публикуваха решения за интегриране на DALL-E 2 в приложения, услуги, уебсайтове и дори Видео игри. С пускането на публичната бета версия, подхранвана от огромната маркетингова сила на OpenAI, синтетичните изображения са готови наистина да навлязат в мейнстрийма.