Janji Apple untuk menjalankan seluruh pemrosesan AI di infrastruktur sendiri tampaknya mulai goyah. Laporan terbaru The Information yang dikutip Wccftech (4 Juni 2026) menyebut Siri generasi baru akan ditenagai model Gemini kustom berukuran triliunan parameter yang berjalan di Google Cloud, bukan di server "Private Cloud Compute" milik Apple. Sebagai gantinya, Apple mengandalkan fitur enkripsi bawaan GPU NVIDIA B200 untuk menjaga data pengguna tetap terlindungi.

Private Cloud Compute Tak Cukup Besar untuk Gemini Kustom Apple

Menurut Wccftech, Siri baru secara internal disebut sebagai "Apple Foundation Models version 11" dan dibangun di atas model Gemini canggih yang dilisensikan dari Google. Padahal, Apple sebelumnya menegaskan bahwa seluruh pemrosesan generative AI akan berlangsung di atas Apple silicon mereka sendiri.

Persoalannya, model Gemini kustom tersebut dilaporkan berukuran triliunan parameter — terlalu besar untuk ditampung infrastruktur Private Cloud Compute yang dibangun Apple. Akibatnya, sebagian permintaan pengguna kini diarahkan langsung ke model Gemini yang berjalan di Google Cloud untuk mendapatkan performa inferensi terbaik.

Jurnalis Mark Gurman menyebut model ini "kompetitif dengan Gemini 3 dan secara signifikan lebih capable" dibanding model yang menjalankan Siri versi pembaruan saat ini. Apple juga dilaporkan menggunakan teknik distillation — menurunkan kemampuan dari model guru (Gemini lisensi) ke model murid berukuran lebih kecil yang bisa berjalan langsung di perangkat pengguna.

Enkripsi B200 Jadi Tameng agar Google Tak Mengintip Data Pengguna

Untuk meredam kekhawatiran privasi atas "Siri yang berjalan di server Google", The Information melaporkan Apple condong meminta Google menempatkan GPU NVIDIA B200 di pusat data mereka khusus untuk beban kerja ini. Alasan utamanya adalah fitur enkripsi data saat diproses (in-use encryption) yang tertanam di B200.

NVIDIA secara resmi menggambarkan fitur ini sebagai mekanisme yang "menjaga kerahasiaan dan integritas model AI yang dijalankan di GPU Rubin, Blackwell, dan Hopper", serta memungkinkan beban kerja AI sensitif berjalan dengan "performa nyaris setara native" bahkan di lingkungan cloud bersama.

Artinya, meskipun model inferensi secara fisik berjalan di pusat data Google, data pengguna selama proses inferensi tetap dienkripsi di dalam GPU dan tidak bisa dibaca mentah oleh software milik Google. Inilah inti kompromi yang dilakukan Apple.

Kontrak Senilai US$1 Miliar per Tahun untuk Model 1,2 Triliun Parameter

Detail kerja sama Apple-Google mulai terkuak melalui laporan pendukung. Apple dilaporkan akan membayar Google sekitar US$1 miliar (sekitar Rp 16,2 triliun) per tahun dalam kontrak multi-tahun. Model Gemini kustom yang dipakai untuk Siri dan Apple Intelligence disebut berukuran 1,2 triliun parameter — sekitar delapan kali lebih besar dari model cloud 150 miliar parameter yang selama ini dioperasikan Apple sendiri.

Angka pembayaran sebesar ini memberi gambaran betapa seriusnya tekanan teknis yang membuat Apple harus melepaskan visi "AI sepenuhnya di Apple silicon". Berikut ringkasan arsitektur Siri baru menurut laporan tersebut:

Lapisan pemrosesanPihak yang menanganiPeran
Model ringan on-deviceApple siliconModel murid hasil distillation
Inferensi cloudNVIDIA B200 di Google CloudModel Gemini kustom 1,2 triliun parameter
Perlindungan privasiConfidential Computing B200Enkripsi data selama proses inferensi

Confidential Computing B200: Perlindungan Berlapis Hingga NVLink

Fitur Confidential Computing pada arsitektur Blackwell tidak hanya mengenkripsi memori GPU. Pada mode CC, bobot model, data latih, dan hasil inferensi yang berada di memori GPU diperlakukan dalam keadaan terenkripsi. Komunikasi antar-GPU lewat NVLink juga dienkripsi secara hardware, sementara lalu lintas CPU-GPU dilewatkan melalui bounce buffer terenkripsi.

Yang lebih menarik, Intel TDX dan NVIDIA bersama-sama menyediakan Dual Remote Attestation — mekanisme verifikasi kriptografis bahwa beban kerja benar-benar berjalan di hardware sah dengan kode yang tidak dimodifikasi. Penyedia layanan seperti Corvex bahkan sudah mengumumkan deployment produksi Confidential Computing di HGX B200, menandakan teknologi ini sudah siap pakai di lingkungan operator pihak ketiga.

Apa Artinya bagi Pengguna Apple di Indonesia?

Penting dicatat, seluruh informasi di atas masih berbasis laporan dan belum dikonfirmasi resmi oleh Apple, Google, maupun NVIDIA. Nama "Apple Foundation Models version 11", komentar Gurman, hingga keputusan B200 semuanya berasal dari sumber pihak ketiga.

Bagi pengguna iPhone di Indonesia yang membeli unit resmi melalui iBox, Digimap, atau Erafone, perubahan ini secara praktis tidak terlihat — Siri akan tetap tampil sebagai asisten Apple dengan janji privasi yang sama. Namun perlu dipahami bahwa beban kerja AI paling berat berpotensi melintasi infrastruktur Google Cloud, bukan lagi sepenuhnya server Apple. Bagi Anda yang sangat memperhatikan privasi data, menunggu pengumuman resmi Apple terkait arsitektur Siri baru menjadi langkah yang paling bijak sebelum menarik kesimpulan.

Sumber