OpenAI-მ ხმოვანი დავალებებისთვის სამი ახალი აუდიომოდელი წარადგინა

ფოტო: 01net.it

ChatGPT-ის შემქმნელმა OpenAI-მა საკუთარი დეველოპერული პლატფორმისთვის სამი ახალი აუდიომოდელი წარადგინა. ახალი მოდელების ჩაშვების მიზანი ხმოვანი კომპლექსური დავალებების რეალურ დროში შესასრულებლად უფრო ძლიერი პროგრამული უზრუნველყოფის აგენტების შექმნაა.

აღნიშნული ტექნოლოგიური სიახლე OpenAI-ის იმ მცირე რაოდენობის ხელოვნური ინტელექტის კომპანიებს შორის ახვედრებს, რომელთა მოდელებსაც მიმოწერის გარდა მოსმენა, თარგმნა და ლაივ-დიალოგების წარმართვა შეუძლიათ.

ახალი მოდელები, სახელად GPT-Realtime-2, GPT-Realtime-Translate-ი და GPT-Realtime-Whisper-ი სატესტო რეჟიმში უკვე ხელმისაწვდომია.

GPT-Realtime-2-ს რთული მოთხოვნების დამუშავება, ზარის ინსტრუმენტების მართვა, წყვეტებთან გამკლავება და საუბრის დროს კონტექსტის შენარჩუნება შეუძლია.

მეორე მოდელის ძირითადი ფუნქცია 70 ენიდან 13 ენაზე სრულყოფილად თარგმნაა, რომლის გამოყენების მთავარი მიმართულებაც მომხმარებელთან კომუნიკაცია და განათლება იქნება.

მესამე მოდელს კი ლაივ-რეჟიმში საუბრის ტექსტად ქცევა შეუძლია და მისი გამოყენების ძირითადი მიმართულება შეხვედრების ჩანაწერების გაკეთება და სამუშაო ნაკადის მართვა იქნება.

ზემოაღნიშნული მოდელების სატესტო ვერსიები გასაცნობად OpenAI-ის სხვადასხვა ტიპის მომხმარებლებს მიეწოდათ. მათ შორის არიან უძრავი ქონების ონლაინბაზარი Zillow-ი, ტურისტული ონლაინსააგენტო Priceline-ი და ევროპული სატელეკომუნიკაციო ფირმა Deutsche Telekom-ი.

GPT-Realtime-2-ის ფასი მილიონი აუდიოტოკენისთვის $32 დოლარიდან იწყება. მეორე მოდელის ღირებულება აუდიომასალის ყოველ წუთზე $0.034-ს შეადგენს, მესამე მოდელის შემთხვევაში კი ეს ტარიფი $0.017-ით განისაზღვრა.

დავით ბერაძე

I specialize in reporting of International Conflicts & Security, Defense Industry, Middle East, Terrorism, War & Peace-making, International Business and Economy.