DeepSeek-ის თქმით, მისი წარმატებული AI-მოდელის „გაწვრთნა“ მხოლოდ $294,000 დაჯდა

DeepSeek-ის თქმით, მისი წარმატებული AI-მოდელის „გაწვრთნა“ მხოლოდ $294,000 დაჯდა

ხელოვნური ინტელექტის ჩინური კომპანია DeepSeek-ის განცხადებით, მან R1-მოდელის მომზადებაზე $294,000 დახარჯა, რაც გაცილებით დაბალია, ვიდრე ამერიკელი კონკურენტების მიერ AI-მოდელების გასაწვრთნელად დახარჯული თანხა. ამის შესახებ აკადემიურ ჟურნალ Nature-ში გამოქვეყნებულ სტატიაშია საუბარი.

DeepSeek-ის მიერ იანვარში ხელოვნური ინტელექტის დაბალი ღირებულების სისტემების გამოშვებამ ინვესტორებს ტექნოლოგიურ კომპანიებში შეძენილი აქციების გაყიდვისკენ უბიძგა. ისინი შიშობდნენ, რომ ჩინურ AI-მოდელებს ბაზარზე ხელოვნური ინტელექტის სფეროს ლიდერების, მათ შორის Nvidia-ს, დომინირებისთვის საფრთის შექმნა შეეძლო.

თუმცა ამის შემდეგ, კომპანია და მისი დამფუძნებელი ლიანგ ვენფენგი, პროდუქტის რამდენიმე ახალი განახლების გაშვების გარდა, ძირითადად საზოგადოების თვალთახედვაში აღარ მოქცეულან.

Nature-ის სტატიაში, რომელშიც ლიანგი ერთ-ერთ თანაავტორად იყო მოხსენიებული, ნათქვამია, რომ DeepSeek-ის მსჯელობაზე ორიენტირებული R1-მოდელის დატრენინგება 294,000 აშშ დოლარი დაჯდა და მასში 512 ერთეული Nvidia H800 ჩიპი იყო გამოყენებული. აღსანიშნავია, რომ სტატიის წინა ვერსია, რომელიც იანვარში გამოქვეყნდა, ამ ინფორმაციას არ შეიცავდა.

ცნობისთვის, OpenAI-ის აღმასრულებელმა დირექტორმა, სემ ოლტმენმა, 2023 წელს განაცხადა, რომ კომპანიის საბაზისო მოდელების დატრენინგება 100 მილიონ დოლარზე „გაცილებით მეტი“ დაჯდა. თუმცა კომპანიას დეტალური ხარჯები არ გაუსაჯაროებია.

DeepSeek-ის განცხადებები მისი AI-მოდელის განვითარების ხარჯებისა და გამოყენებული ტექნოლოგიის შესახებ აშშ-ის კომპანიებმა და ოფიციალურმა პირებმა კითხვის ნიშნის ქვეშ დააყენეს. განცხადებებში ნახსენები H800 ჩიპები Nvidia-მ ჩინეთის ბაზრისთვის შექმნა მას შემდეგ, რაც აშშ-მა 2022 წლის ოქტომბერში უფრო მძლავრი H100 და A100 ხელოვნური ინტელექტის ჩიპების ჩინეთში ექსპორტი აკრძალა.

აშშ-ის ოფიციალურმა პირებმა ივნისში Reuters-ს განუცხადეს, რომ DeepSeek-ს წვდომა აქვს H100 ჩიპების „დიდ რაოდენობაზე“, რომლებიც ქვეყნის მიერ ექსპორტის კონტროლის დაწესების შემდეგ იქნა შეძენილი. Nvidia-მ კი განმარტა, რომ DeepSeek-მა კანონიერად შეძენილი H800 ჩიპები გამოიყენა და არა – H100-ები.