Generasi model baru DeepSeek telah menjadi fokus perdebatan teknologi dengan sebuah proposal yang sangat jelas: konteks hingga satu juta token dan arsitektur lebih dari satu triliun parameter Dirancang agar efisien dan, yang terpenting, jauh lebih murah daripada alternatif sistem tertutup di Amerika Serikat, perusahaan Tiongkok ini telah mengerahkan semua kemampuannya pada V4, sebuah keluarga produk yang menggabungkan bobot terbuka, jendela konteks yang besar, dan strategi penetapan harga yang agresif.
Langkah ini diambil pada saat Eropa dan Spanyol sedang mencermati biaya dan kedaulatan teknologi AI. DeepSeek V4 menawarkan diri sebagai pilihan menarik bagi perusahaan rintisan, UKM, dan perusahaan besar di Eropa. yang membutuhkan kemampuan tingkat terdepan, tetapi tidak dapat—atau tidak ingin—bergantung sepenuhnya pada API berpemilik yang mahal atau perangkat keras eksklusif seperti GPU NVIDIA yang paling dicari.
Keluarga V4 yang berpusat pada 1T parameter dan konteks 1M token.

DeepSeek telah mengumumkan kehadiran DeepSeek-V4 Preview sebagai serangkaian model terbuka yang berpusat pada dua gagasan: jendela konteks hingga 1 juta token dan arsitektur raksasa berdasarkan Mixture-of-Experts (MoE)Dalam keluarga produk ini, terdapat dua varian utama yang menonjol: DeepSeek-V4-Pro dan DeepSeek-V4-Flash, keduanya dengan konteks 1M sebagai ciri khasnya.
Pada tingkat ambisi tertinggi, V4-Pro beroperasi pada angka-angka sebagai berikut: hingga total 1,6 triliun parameter (1,6T), meskipun hanya mengaktifkan antara 32 dan 49 miliar parameter di setiap langkah inferensi berkat skema MoE, yang sangat penting untuk menjaga efisiensi. Secara paralel, perusahaan telah memperkenalkan varian yang lebih ringan, seperti V4-Flash dan V4-Lite, dengan sekitar 284-285 miliar total parameter dan sekitar 13 miliar parameter aktif, yang dirancang untuk penerapan di mana kecepatan dan biaya menjadi prioritas.
Jumlah total parameter menempatkan keluarga V4 di puncak pasar, tetapi detail pentingnya adalah bahwa Hanya sebagian kecil dari para ahli tersebut yang diaktifkan melalui token.Hal ini memungkinkan DeepSeek berperilaku seperti model raksasa dalam hal kapasitas, tetapi dengan konsumsi daya komputasi yang lebih dekat dengan model yang jauh lebih kecil. Pendekatan ini sesuai dengan narasi DeepSeek: bersaing dengan model besar dan tertutup tanpa meningkatkan biaya penggunaan secara drastis.
Perusahaan juga telah merilis varian awal seperti V4-Lite, yang berfungsi sebagai validasi teknis, dan telah menyesuaikan jadwal peluncurannya. Meskipun V4 masih dalam tahap pengujian terbatas. Dalam beberapa konteks, keluarga V4 Preview sudah dapat digunakan di chatbot resmi dan melalui API perusahaan yang telah diperbarui, dengan konteks 1M sebagai nilai default dalam layanannya.
Arsitektur hibrida dan perpaduan para ahli untuk membuat konteks jangka panjang menjadi layak.
Kunci kemampuan DeepSeek untuk menawarkan jendela konteks satu juta token tanpa biaya inferensi yang meroket terletak pada arsitekturnya. Produsen menjelaskan bahwa V4 memperkenalkan kombinasi perawatan hibrida, gabungan para ahli, dan teknik kompresi. dirancang untuk bekerja dengan urutan yang sangat panjang, mengurangi FLOP per token dan memori yang dibutuhkan.
Di antara komponen teknis yang disebutkan perusahaan, berikut ini yang paling menonjol: MLA (Multi-Head Latent Attention), DSA atau DeepSeek Sparse Attention, dan mekanisme memori bersyarat seperti Engram.Secara bersama-sama, komponen-komponen ini bertujuan untuk mengurangi beban perhitungan perhatian, terutama ketika model harus menangani ratusan ribu atau satu juta token dalam satu kali proses.
Menurut data yang dibagikan oleh perusahaan itu sendiri, dalam skenario 1 juta token DeepSeek-V4-Pro mungkin hanya membutuhkan sekitar 27% FLOPs per token dan hanya 10% cache KV dibandingkan dengan versi sebelumnya seperti DeepSeek-V3.2.Varian yang lebih ringan, seperti V4-Flash, semakin mengurangi angka-angka ini, memposisikan diri sebagai solusi inferensi cepat untuk aplikasi di mana latensi sangat penting.
Peningkatan jenis ini bukan sekadar teori: perusahaan mengklaim bahwa kombinasi MoE, perhatian yang tersebar, dan pemahaman konteks memungkinkan beroperasi dengan konteks ultra-panjang dalam perangkat keras yang kurang ekstrem Biaya per juta token sudah jauh lebih rendah daripada banyak model tertutup dengan jendela 128 ribu atau 200 ribu token.
Kinerja dalam penalaran, pemrograman, dan tugas-tugas keagenan.
DeepSeek tidak hanya ingin menonjol karena ukuran dan konteksnya. Dalam perbandingan internalnya, perusahaan tersebut menegaskan bahwa V4-Pro dan variannya telah dioptimalkan secara khusus untuk penalaran kompleks, pemrograman, dan agen.Ketiga area ini saat ini menyumbang sebagian besar permintaan bisnis. Tolok ukur seperti SWE-bench, yang dirancang untuk mengukur kapasitas Memahami dan memodifikasi repositori kodeAda pembicaraan mengenai angka akurasi di atas 80%, sejalan dengan model tertutup terkemuka.
Dalam penalaran yang lebih umum—termasuk matematika, disiplin ilmu STEM, dan masalah rantai pemikiran—perusahaan menempatkan V4-Pro sebagai salah satu model terbuka terkuatdan berpendapat bahwa hal itu mendekati tingkat proposal perbatasan tertutup. Dalam hal kesadaran global, data internal menempatkannya di garis depan ekosistem terbuka dan hanya di belakang beberapa model kepemilikan yang sangat spesifik, seperti varian lanjutan tertentu dari Gemini.
Di luar angka-angka tersebut, penekanannya adalah pada... tugas-tugas agenik Hal ini menunjukkan penggunaan yang jauh melampaui obrolan dasar. DeepSeek mengklaim bahwa V4 sudah menggerakkan infrastruktur agen kode dan sistemnya sendiri yang menghubungkan berbagai langkah.Mereka mengakses berbagai alat dan bekerja pada repositori atau basis data dokumen yang ekstensif. Pendekatan ini sejalan dengan tren industri saat ini, di mana banyak perusahaan tidak lagi hanya mencari chatbot, tetapi juga asisten yang mampu beroperasi sebagai "rekan kerja digital" dalam alur kerja yang kompleks.
Perbandingan ini sebaiknya ditanggapi dengan hati-hati: seperti halnya hampir semua rilis AI terbaru, Sebagian besar data berasal dari perusahaan itu sendiri dan dari pengujian di lingkungan yang terkontrol.Meskipun demikian, kombinasi konteks jangka panjang, arsitektur yang efisien, dan kinerja yang kompetitif menarik perhatian para pengembang Eropa yang membandingkan biaya dan kemampuan dengan opsi seperti GPT, Claude, Llama, atau Mistral.
Model terbuka, bobot yang dipublikasikan, dan kompatibilitas dengan API populer.
Salah satu faktor kunci yang membuat DeepSeek terkenal adalah komitmennya terhadap ekosistem terbuka. Dengan V4, perusahaan memperkuat pendekatan ini: telah menerbitkan laporan teknis dan merilis bobot terbuka dari keluarga tersebut di platform seperti Hugging Face.Memungkinkan para peneliti, perusahaan, dan administrasi publik untuk mengunduh model-model tersebut dan menjalankannya di infrastruktur mereka sendiri.
Pendekatan bobot terbuka ini, berbeda dengan proposal yang sepenuhnya tertutup dari banyak laboratorium di AS, memiliki implikasi yang jelas bagi Spanyol dan Uni Eropa. Kemungkinan penerapan model-model ini di pusat data di Uni Eropadi bawah kerangka kerja seperti GDPR dan regulasi AI masa depan Uni Eropa.Ini menawarkan cara untuk mempertahankan kendali yang lebih besar atas data tanpa mengorbankan kemampuan tingkat atas.
Dari segi integrasi praktis, DeepSeek memilih untuk mengurangi hambatan: API ini mempertahankan base_url yang sama dan kompatibel dengan skema ChatCompletions OpenAI dan dengan Antarmuka antroposentrisBagi banyak tim pengembang, ini berarti bahwa migrasi pengujian atau sebagian lalu lintas ke V4 pada dasarnya terbatas pada mengubah pengidentifikasi model menjadi deepseek-v4-pro atau deepseek-v4-flash dan menyesuaikan beberapa parameter.
Pada saat yang sama, perusahaan telah menetapkan jadwal untuk menghentikan dukungan untuk model-model lama, seperti deepseek-chat dan deepseek-reasoner. Produk-produk tersebut akan dihentikan dan dialihkan ke V4-Flash. sampai penarikan totalnya, yang memaksa mereka yang menggunakannya untuk mulai mempersiapkan migrasi. Ini adalah cara yang jelas untuk memusatkan penawaran pada generasi baru dan menghindari fragmentasi basis pengguna ke dalam terlalu banyak varian lama.
Biaya inferensi terkendali dan fokus pada efisiensi ekonomi.
Narasi DeepSeek sejak awal kemunculannya selalu berpusat pada efisiensi. Dengan V4, wacana tersebut diperkuat oleh kombinasi arsitektur MoE, perhatian terdistribusi, dan optimasi perangkat keras yang bertujuan untuk... menurunkan biaya per juta token ke level yang jauh di bawah biaya API premium yang paling terkenal.Beberapa analisis eksternal menyebutkan angka sekitar $0,30 per juta token masuk untuk konfigurasi tertentu, sebagian kecil dari harga yang dikenakan oleh model tertutup kelas atas.
Dalam konteks Eropa, di mana infrastruktur dan biaya energi menjadi hal yang relevan, fokus pada efisiensi ini sangat sesuai dengan kebutuhan perusahaan rintisan dan UKM. Memproses dokumen hukum yang ekstensif, catatan medis yang panjang, atau seluruh repositori perangkat lunak. Hal ini перестает menjadi kemewahan yang hanya diperuntukkan bagi perusahaan dengan anggaran yang hampir tak terbatas dan menjadi bagian dari skenario yang terjangkau untuk proyek-proyek yang sedang berkembang.
Beberapa penyedia infrastruktur AI sudah menawarkan akses awal ke node berbasis DeepSeek V4 sebagai bagian dari katalog mereka, sehingga memudahkan perusahaan-perusahaan Eropa. Mereka dapat mengevaluasi kinerja dan biaya sebenarnya tanpa harus membangun infrastruktur mereka sendiri dari awal.Bagi banyak organisasi, fase pengujian ini merupakan langkah awal sebelum memutuskan apakah akan melanjutkan dengan model outsourcing atau memilih penerapan on-premise.
Sementara itu, kebungkaman sebagian dari perusahaan mengenai biaya pelatihan yang tepat dan perangkat keras spesifik yang digunakan telah menimbulkan keraguan di beberapa sektor. Sejak tahun 2025, kecurigaan telah beredar tentang volume sebenarnya dari sumber daya yang dibutuhkan untuk melatih modelnya, termasuk perkiraan yang mengarah pada puluhan ribu GPU kelas atas. DeepSeek menegaskan bahwa mereka telah mencapai tahap baru "konteks jangka panjang yang menguntungkan".Namun, hal itu belum sepenuhnya memperjelas ketidakpastian mengenai skala material dari operasinya.
Dampak pada perusahaan rintisan dan perusahaan di Spanyol dan Eropa
Bagi ekosistem kewirausahaan Eropa, dan khususnya bagi perusahaan rintisan teknologi di Spanyol, munculnya model seperti DeepSeek V4 membuka pilihan yang hingga baru-baru ini sulit dipertimbangkan. Akses model dengan lebih dari satu triliun parameter dalam konteks 1 juta token dan bobot terbuka. Ini memungkinkan Anda untuk menjelajahi produk-produk canggih tanpa bergantung sepenuhnya pada pemasok dari Silicon Valley.
Di sektor-sektor yang diatur—keuangan, kesehatan, hukum, administrasi publik—kemungkinan Jalankan model tersebut di pusat data di Uni Eropa atau bahkan di fasilitas Anda sendiri. Hal ini sangat relevan. Kepatuhan terhadap GDPR dan peraturan perlindungan data nasional menjadi lebih mudah dikelola ketika informasi tidak perlu meninggalkan yurisdiksi Eropa untuk diproses oleh model AI.
Startup Spanyol yang bekerja dengan volume dokumen besar, seperti legaltech, healthtech, atau alat pengembang, dapat memanfaatkan konteks 1 juta token untuk menganalisis berkas lengkap, riwayat medis yang sangat panjang, atau repositori kode yang besar. tanpa perlu membaginya menjadi beberapa bagian dan merancang sistem pemulihan yang rumit. Hal ini mengurangi kompleksitas teknis dan, dalam banyak kasus, juga mengurangi latensi.
Pada saat yang sama, penting untuk tetap mengingat risikonya: ekosistem alat-alat di sekitar DeepSeek lebih muda dibandingkan dengan model terbuka lainnya seperti Llama, dan Dokumentasi dan dukungan komunitas masih dalam tahap pengembangan.Selain itu, fakta bahwa ini adalah perusahaan Tiongkok menghadirkan komponen geopolitik yang dipandang dengan waspada oleh beberapa organisasi Eropa, terutama dalam proyek-proyek yang terkait dengan administrasi atau infrastruktur penting.
Langkah yang memberikan tekanan pada model tertutup yang berbiaya tinggi.
Di luar spesifikasi khususnya, DeepSeek V4 ditafsirkan dalam sektor ini sebagai langkah lebih lanjut dalam tekanan kompetitif pada model tertutup termahal di pasaran.Dengan menetapkan konteks token 1 juta sebagai standar di seluruh layanan resminya dan menyertainya dengan bobot terbuka, perusahaan Tiongkok ini mengirimkan pesan yang jelas: konteks ultra-panjang tidak lagi perlu menjadi fitur eksklusif dari beberapa model eksklusif berharga tinggi.
Bagi laboratorium-laboratorium besar di negara-negara Barat, hal ini menimbulkan tantangan. OpenAI, Anthropic, dan Google secara historis telah menggunakan kombinasi dari kualitas lebih tinggi, konteks lebih luas, dan ekosistem eksklusif Sebagai proposisi nilai. Munculnya alternatif terbuka dengan konteks yang bahkan lebih unggul dalam beberapa kasus dan biaya yang sangat rendah memaksa peninjauan kembali strategi produk dan penetapan harga, terutama di segmen di mana margin perusahaan pengguna sangat ketat.
Di dunia berbahasa Spanyol, di mana banyak perusahaan rintisan beroperasi dengan anggaran yang jauh lebih sederhana daripada perusahaan sejenis di Amerika Serikat, tekanan persaingan justru menguntungkan mereka. Semakin canggih dan terbuka model yang tersedia, semakin besar kemampuan tim teknis untuk memilih berdasarkan harga, kepatuhan terhadap peraturan, dan kasus penggunaan.dan bukan hanya dari merek di balik API tersebut.
Pada saat yang sama, DeepSeek menyadari bahwa taruhannya bukannya tanpa tantangan: sebagian besar tolok ukur dan perbandingan berasal dari dokumentasi mereka sendiri atau dari pengujian dalam fase pratinjau, dan pasar masih menunggu untuk melihat bagaimana kinerja model V4 ketika diterapkan secara massal di lingkungan produksi yang menuntut, termasuk lingkungan di Eropa.
Secara keseluruhan, hadirnya DeepSeek V4 memperkuat tren yang telah berkembang selama beberapa waktu: Model AI mutakhir bukan lagi domain eksklusif segelintir perusahaan dengan sistem tertutup dan anggaran yang sangat besar.Dengan kombinasi lebih dari 1 triliun parameter, konteks 1 juta token, bobot terbuka, dan wacana yang berfokus pada efisiensi, perusahaan Tiongkok ini memperkenalkan alternatif yang sulit diabaikan oleh perusahaan dan pengembang di Spanyol dan Eropa dalam rencana mereka mendatang untuk mengadopsi dan memperbarui infrastruktur AI.