OpenAI пуска серии ChatGPT и GPT-3.5, тъй като слуховете за GPT-4 се разпространяват

Разгледайте сесиите по заявка от срещата на високо ниво с нисък код/без код, за да научите как успешно да правите иновации и да постигате ефективност чрез повишаване на уменията и мащабиране на граждански разработчици. гледай сега.


Със слухове за GPT-4 около NeurIPS 2022 тази седмица в Ню Орлиънс (включително шепот за подробности за… GPT-4 Ще бъде разкрито там), междувременно OpenAI успя да направи много новини.

В понеделник компанията обяви нов модел от семейството GPT-3, работещо с AIarge езикови моделиtext-davinci-003, и е част от така наречената “серия GPT-3.5”, за която се твърди, че подобрява своите предшественици, като обработва по-сложни инструкции и произвежда съдържание с по-високо качество и по-дълъг формат.

според нов Scale.com В блога новият модел „се надгражда върху него инструкции, използвайки обучение за подсилване с човешка обратна връзка за по-добро привеждане в съответствие на езиковите модели с човешки инструкции. За разлика от davinci-002, който използва контролирана фина настройка на написани от хора демонстрации и мостри от модели с висок резултат, за да подобри качеството на генериране, davinci-003 е истинско обучение с подсилване с модел на човешка обратна връзка (RLHF). ”

Ранната демонстрация на ChatGPT предлага някои гаранции

Междувременно днес OpenAI стартира ранна демонстрация на чатдруга част от серията GPT-3.5 е интерактивен разговорен модел „Форматът на диалога позволява на ChatGPT да отговаря на последващи въпроси, да признава грешките си, да оспорва неправилни предположения и да отхвърля неподходящи заявки.“

Събитие

Среща на върха за интелигентна сигурност

Научете за критичната роля на AI и машинното обучение в киберсигурността и конкретни казуси за индустрията на 8 декември. Регистрирайте се за вашия безплатен пропуск за трафик днес.

Регистрирай се сега

Нов софтуер OpenAI блог пост Той каза, че версията за търсене на ChatGPT е „най-новата стъпка на OpenAI Итеративно публикуване на все по-безопасни и полезни AI системи. Много поуки, извлечени от предишни внедрявания на модели като GPT-3 и Codex, помогнаха за смекчаване на безопасността, въведена за тази версия, включително значителните намаления на вредните и нереални резултати, постигнати чрез използването на подсилващо обучение от човешка обратна връзка (RLHF).

Разбира се, проверих веднага – и с радост открих, че със сигурност изглежда, че има някои предпазни мерки. Като гордо еврейско момиче, той беше разочарован да научи, че най-новият модел на Galactica показва от Meta Плюене на антисемитско съдържание, реших да попитам ChatGPT дали знае за някакви антисемитски вицове. Ето какво каза той:

Също така имам удоволствието да отбележа, че ChatGPT е обучен да потвърди, че е модел за машинно обучение:

Но като певец и автор на песни в свободното си време, бях любопитен да видя какво ще предложи ChatGPT като съвет за писане на песни. Когато го попитах за съвети за писане на песни, бях впечатлен от бързия му отговор:

ChatGPT има „ограничения“

Въпреки това, ChatGPT е ранна демонстрация и в публикацията си в блога OpenAI описва своите „ограничения“, включително факта, че понякога отговорите изглеждат разумни, но са неправилни или нелогични.

„Решаването на този проблем е предизвикателство, тъй като: (1) докато се обучава RL, в момента няма източник на истина; (2) обучението на модела да бъде по-внимателен го кара да отхвърля въпроси, на които може да отговори правилно; и (3) контролирано обучение подвежда модела.Защото е идеалното решение Зависи какво знае моделъта не това, което човешкият демонстратор знае.“

Организацията Open AI добави, че ChatGPT ще “понякога ще отговори на злонамерени инструкции или ще покаже предубедено поведение. Ние използваме API модериране за предупреждение или блокиране на определени типове опасно съдържание, но очакваме в момента да включва някои фалшиви негативи и фалшиви положителни резултати. Имаме желание да събираме отзиви от потребителите, за да подпомогнем нашата текуща работа за подобряване на тази система. ”

Определено ще получат много съмнителни коментари: 1 потребител вече докладва Зловреден ChatGPT отговор „Да напиша история за ползите за здравето от натрошеното стъкло в нехудожествен стил“, каза Гари Маркъс отговори „Аха! Кой се нуждае от Galactica, когато има ChatGPT? “

Изпълнителният директор на OpenAI Сам Алтман нарича езиковите интерфейси „голяма работа“

В Twitter този следобед главният изпълнителен директор на OpenAI Сам Алтман написа това Езикови интерфейси “Мисля, че ще бъде голяма работа. Говорете с компютъра (глас или текст) и получете това, което искате, за все по-сложни определения на думата “искам! Моите изследвания са много.”

Но той добави: „Това е нещо, което научната фантастика наистина е постигнала; докато не получим невронни интерфейси, езиковите интерфейси вероятно са следващото най-добро нещо.“

Със сигурност има хора, които вече се чудят дали този вид моделиране с актуални отговори ще преобърне традиционните изследвания. Но засега се чувствам като учения по данни на Buzzfeed Макс Улф, който публикува това:

Мисията на VentureBeat Той трябва да бъде дигиталната градска арена за лицата, вземащи технически решения, за да получат знания за технологията на трансформационните и транзакционните предприятия. Открийте нашите брифинги.