OpenAI uvádí novou verzi jazykového modelu GPT-4o

OpenAI uvádí novou verzi jazykového modelu GPT-4o | foto: OpenAI, Technet.cz

Umělá inteligence od OpenAI má nový pohon. A rovnou ho dává zadarmo

  • 9
Společnost OpenAI vůbec poprvé pořádala živé představení svých pokroků. Hlavní novinkou se stala nová veze jazykového modelu, který firma nazvala GPT-4o. Dokáže přímo pracovat jak s textem, tak se zvukem i obrazem.

Pro uživatele služeb této společnosti měla technologická ředitelka OpenAI Mira Muratiová dobrou zprávu, když oznámila, že nový model GPT-4o (kde „o“ zastupuje výraz „omni“) bude nabízen zdarma. Nový model by měl být podobně „inteligentní“ jako placený GPT-4 a nebude vyžadovat ani registraci.

Uživatelé, kteří si doposud platili přístup k vyspělejším modelům GPT-4 a GPT-4Turbo či další funkce, nyní v rámci předplatného získají možnost využít pětkrát více požadavků denně na GPT-4o než v případě bezplatného plánu. Po překročení limitu bude uživatel automaticky přepnut na model GPT-3.5.

„Začínáme zavádět GPT-4o pro uživatele ChatGPT Plus a Team a brzy bude k dispozici i pro firemní uživatele. Dnes také začínáme zavádět službu ChatGPT Free s limity používání. Uživatelé Plus budou mít limit zpráv až 5× vyšší než uživatelé zdarma a uživatelé Team a Enterprise budou mít limity ještě vyšší,“ vysvětluje OpenAI na webu.

Nový model má být přitom optimalizovaný tak, že v aplikačním rozhraní (API) bude dvojnásobně rychlý a jeho běh přitom o polovinu levnější než GPT-4.

„Na zvukové vstupy dokáže reagovat za pouhých 232 milisekund, v průměru za 320 milisekund, což je podobná doba reakce jako u člověka při rozhovoru. Shoduje se s výkonem GPT-4 Turbo u textu v angličtině a kódu, přičemž u textu v neanglických jazycích je výrazně lepší. GPT-4o je ve srovnání se stávajícími modely lepší zejména v oblasti vidění a porozumění zvuku,“ popisuje schopnosti tým OpenAI.

Zájemci se zároveň mohou těšit na nové desktopové rozhraní pro macOS, které bude obsahovat hlasový režim stejně, jako je tomu u mobilní aplikace. Ten nyní zvládne například živý překlad nebo hlasové reakce bez toho, aby vše přepisoval. To také znamená, že se vše zrychlí a není třeba čekat, až systém domluví, a lze ho přerušit dalším dotazem.

Na prezentaci to jeden ze zaměstnanců ukazoval na příkladu, kdy se GPT-4o zeptal, co by mu systém poradil, jak se vypořádat s trémou před vystoupením na veřejnosti. ChatGPT poháněný GPT-4o mu mimo jiné poradil, aby se uklidnil několika hlubokými nádechy. Když pak začal do mikrofonu přerývaně a hlasitě dýchat, systém ho upozornil, že není vysavač.

V jedné z ukázek nechali systém vymyslet a předčítat pohádku na dobrou noc různými hlasy, pak s přidáním emocí a nakonec ji i zazpívat.

ChatGPT s podporou nového jazykového modelu také zvládl pomoci s řešením matematické rovnice napsané na listu papíru a snímané kamerou mobilního telefonu. Díky schopnosti komunikace hlasem dokázal radit uživateli, přičemž umělá inteligence reagovala i na změny, které na papíře uživatel provedl.

„Nyní například můžete vyfotit jídelní lístek v cizím jazyce a požádat GPT-4o, aby vám ho přeložil, řekl něco o historii a významu jídla a nabídl doporučení. V budoucnu umožní další vylepšení, přirozenější hlasovou konverzaci v reálném čase včetně jednání s ChatGPT prostřednictvím živého videa. Můžete například ChatGPT ukázat živě vysílaný sportovní zápas a požádat ho, aby vám vysvětlil pravidla. Nový hlasový režim s těmito novými možnostmi plánujeme spustit v alfa verzi v příštích týdnech, přičemž uživatelé služby Plus k němu budou mít předčasný přístup,“ popisují zástupci firmy schopnosti nového modelu.

Díky kameře by měl nový systém být schopen i rozpoznat emoce při pohledu na obličej zabíraného uživatele.