Jakarta, CNBC Indonesia - Kemunculan model AI R1 DeepSeek asal China sempat menghebohkan dunia dan mengguncang raksasa teknologi Amerika Serikat (AS). Pasalnya, sistem AI tersebut mampu mendobrak persepsi bahwa pengembangan AI memakan biaya besar.
DeepSeek mengklaim mampu mengembangkan AI berkinerja tinggi yang bisa menyaingi AI buatan AS dengan biaya jauh lebih murah. Saat peluncurannya, saham raksasa teknologi AS ramai-ramai rontok.
Terlebih, DeepSeek muncul saat AS menggila memblokir akses chip dan alat pembuat chip canggih ke China. DeepSeek membuktikan China mampu mengembangkan AI canggih secara mandiri tanpa bergantung dengan AS.
Pekan lalu, DeepSeek merilis versi pembaruan R1 yang berkinerja moncer dalam memroses angka matematika dan pengkodean. Perusahaan tidak mengungkan sumber data yang digunakan pada model tersebut, namun para peneliti AI berspekulasi sebagian datanya berasal dari keluarga AI Gemini milik Google.
Sam Paech, developer asal Melbourne yang menciptakan sistem evaluasi intelijen emosional untuk AI, mempublikasikan laporan yang diklaim sebagai bukti bahwa model terbaru DeepSee dilatih dengan output dari Gemini.
Ia mengatakan model baru DeepSeek yang dinamai R1-0528 menggunakan kata-kata dan ekspresi yang mirip dengan Gemini 2.5 Pro milik Google, dikutip dari TechCrunch, Rabu (4/6/2025).
Memang, laporan itu bukan bukti kuat. Namun, pengembang lain yang merupakan pencipta sistem evaulasi AI bernama SpeechMap, mencatat model DeepSeek "terbaca seperti jejak Gemini."
Itu bukan bukti kuat. Namun pengembang lain, pencipta anonim dari "evaluasi kebebasan berbicara" untuk AI yang disebut SpeechMap, mencatat jejak model DeepSeek terbaca seperti jejak model Gemini.
Sebagai catatan, jejak model merupakan 'pikiran' yang dikumpulkan suatu model AI untuk menghasilkan kesimpulan.
DeepSeek memang sudah lama dicurigai menggunakan data dari sistem AI pesaing untuk melatih model AI-nya. Pada Desember lalu, beberapa pengembang melakukan observasi ke model V3 milik DeepSeek dan mengatakan sistem tersebut kerap mengidentifikasi dirinya sebagai ChatGPT buatan OpenAI asal AS.
Hal ini mengindikasikan bahwa model V3 milik DeepSeek kemungkinan dilatih menggunakan chat log milik ChatGPT.
Awal tahun ini, OpenAI memberi tahu Financial Times bahwa mereka menemukan bukti yang menghubungkan DeepSeek dengan penggunaan distilasi, yakni sebuah teknik untuk melatih model AI dengan mengekstrak data dari model yang lebih besar dan lebih canggih.
Menurut Bloomberg, Microsoft, kolaborator dan investor dekat OpenAI, mendeteksi bahwa sejumlah besar data diekstraksi melalui akun pengembang OpenAI pada akhir tahun 2024. Akun itu diyakini OpenAI berafiliasi dengan DeepSeek.
Distilasi bukan praktik yang tidak umum, tetapi ketentuan layanan OpenAI melarang pelanggan menggunakan keluaran model perusahaan untuk membangun AI saingan.
Para ahli AI seperti Nathan Lambert, seorang peneliti di lembaga penelitian AI nirlaba AI2, tidak menganggap mustahil bahwa DeepSeek melatih modelnya menggunakan data dari Gemini milik Google.
"Jika saya DeepSeek, saya pasti akan membuat banyak sekali data sintetis dari model API terbaik di luar sana," tulis Lambert dalam sebuah posting di X.
"[DeepSeek] kekurangan GPU dan punya banyak uang. Secara harfiah, komputasinya jauh lebih efektif," ia menambahkan.
(fab/fab)
Saksikan video di bawah ini:
Video: Jurus Investasi Kripto Saat "Titah" Trump Bikin Gejolak Pasar
Next Article Biden Batasi Chip AI ke RI, Manusia Rp 2.000 Triliun Ketar-ketir