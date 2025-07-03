Bisakah internet seperti yang kita kenal bertahan di era AI? Cloudflare percaya itu bisa, setidaknya dalam hal melindungi pembuat konten. Raksasa teknologi, yang membantu mengelola dan mengamankan lalu lintas untuk 20% web, mengumumkan minggu ini bahwa mereka akan menjadi penyedia infrastruktur internet pertama untuk memblokir perayap AI yang mengikis situs tanpa kompensasi atau izin.
Langkah-langkah ini, yang disambut baik oleh perusahaan media besar seperti The Atlantic, Fortune, TIME dan The Associated Press, serta perusahaan teknologi seperti Pinterest dan Reddit, merupakan langkah pertama menuju pembangunan pasar “bayar per crawl“, tulis Cofounder dan CEO Cloudflare Matthew Prince.
“Cloudflare, bersama dengan mayoritas penerbit dan perusahaan AI terkemuka di dunia, mengubah default untuk memblokir perayap AI kecuali mereka membayar pembuat konten untuk konten mereka,” tulisnya. “Konten itu adalah bahan bakar yang menggerakkan mesin AI, jadi wajar jika pembuat konten diberi kompensasi langsung untuk itu.”
Dan itu baru permulaan. Selanjutnya, kita akan bekerja di pasar di mana pembuat konten dan perusahaan AI, besar dan kecil, dapat bersatu. Lalu lintas selalu merupakan proksi yang buruk untuk nilai. Kami pikir kami bisa melakukan yang lebih baik.”
Dengan munculnya AI generatif dan pencarian AI yang didukung oleh Anthropic, OpenAI, Meta, dan Perplexity, web mulai kedatangan jenis pengunjung baru: bot scraper. Pergeseran ini tidak hanya memengaruhi penerbit berita, yang mengandalkan trafik rujukan untuk menghasilkan uang dari jurnalisme mereka, tetapi juga para pembuat konten dan platform teknologi besar. Dalam satu contoh, Reddit baru-baru ini mengajukan gugatan terhadap Anthropic dan mengklaim bot mengikis kontennya—yangdibantah oleh Anthropic.
“Perusahaan teknologi juga dipengaruhi oleh perayap AI,” kata Will Allen, Head of AI Control, Privacy and Media Products di Cloudflare dalam sebuah wawancara dengan IBM® Think. “Pinterest, Quora dan Reddit adalah beberapa situs teknologi konten buatan pengguna paling populer yang telah masuk untuk mendukung pendekatan berbasis izin kami untuk perayap AI, bersama dengan perusahaan di ruang AI seperti ProRata AI dan Hyperscience.”
Bot digunakan untuk pelatihan, tetapi juga untuk Retrieval-Augmented Generation (RAG), yang menghubungkan model AI generatif ke basis pengetahuan eksternal, seperti konten yang tersedia untuk umum di internet. Menurut laporan yang dirilis bulan lalu oleh perusahaan teknologi TollBit, lalu lintas bot RAG yang diamati di situs mitra mereka tumbuh 49%, hampir 2,5 kali lipat dari lalu lintas bot pelatihan di 18%. Dari 12 bot teratas yang merayapi situs web, TollBit menemukan bahwa pada kuartal pertama tahun 2025, ChatGPT, Meta, dan Perplexity adalah yang paling aktif, membentuk total sekitar 70% dari rata-rata goresan bulanan oleh bot AI.
Lalu lintas baru ini berdampak pada server dan mendorong meningkatnya biaya pada infrastruktur penerbit. Pada bulan April, Wikimedia, organisasi nirlaba di balik Wikipedia, mencatat bahwa 65% lalu lintas termahal berasal dari bot. “Konten kami gratis, infrastruktur kami tidak,” kata organisasi itu dalam postingan blog.
Bot yang haus data juga memengaruhi rasio klik-tayang di halaman hasil mesin pencari, atau SERP, yang telah mengalami penurunan tajam dalam beberapa bulan terakhir. Ambil contoh Ikhtisar AI Google: studi terbaru oleh perusahaan pemasaran Ahrefs menunjukkan bahwa Ikhtisar AI, sebuah produk yang diluncurkan oleh raksasa pencarian tersebut kepada setiap pengguna pada bulan Mei lalu, mengurangi klik sebesar 34,5%. Sementara AI Overview terus bertumbuh—sebesar 116% sejak Maret lalu—situs yang disajikan di SERP mengalami penurunan.
“Artinya, jika Anda menghasilkan uang melalui langganan, melalui iklan, [melalui] hal-hal yang dilakukan pembuat konten hari ini, pengunjung tidak akan melihat iklan itu,” kata Pangeran Cloudflare selama wawancara baru-baru ini di CNBC. “Mereka tidak akan membeli langganan itu lagi. Dan itu berarti akan jauh, jauh lebih sulit bagi Anda untuk menjadi pembuat konten.”
Tetapi tidak semua bot sama: dengan munculnya bot perayapan AI juga muncul peningkatan bot yang bermaksud baik—dan yang tidak dikenal.
Salah satu pendiri Miso Technologies dan CEO Lucky Gunasekara memimpin Project Sentinel, yang memantau lebih dari 8.300 situs dari penerbit terkemuka di seluruh dunia dalam berita dan akademisi, termasuk Newsweek, The Guardian, USA Today, dan BBC. Menurut angka yang dikumpulkan untuk proyek tersebut, ada lebih dari 1.700 bot di radar 7.000 penerbit, Gunasekara berbagi dengan IBM Think. Angka ini tumbuh 35% sejak Februari, sementara sebagian besar penerbit hanya menargetkan 17 bot.
“Kami berbicara dengan banyak penerbit, dan tanda tanya adalah bagaimana kami tahu bahwa ini berhasil ketika menyangkut aktor kecil yang buruk,” katanya dalam sebuah wawancara. Di antara bot terbesar yang dia pantau, dia menemukan beberapa yang tidak dapat dikaitkan dengan perusahaan AI besar. “Apa yang kita lakukan ketika aktor jahat membeli 100.000 alamat IP yang hanya sekumpulan bot?” dia bertanya.
Allen juga membedakan “operator crawler, bot, dan agen yang berniat baik” yang menginginkan cara yang jelas untuk mengidentifikasi bot mereka kepada pemilik situs dari aktor jahat. “Proposal dan dukungan kami untuk WebAuthn [autentikasi web] terus menerima banyak dukungan dan kolaborasi di seluruh ekosistem teknologi,” katanya.
“Ketika aktor jahat mencoba merayapi situs web dalam skala besar, mereka umumnya menggunakan alat dan kerangka kerja yang dapat kita sidik jari. Kami menggunakan jaringan Cloudflare dengan rata-rata lebih dari 57 juta permintaan per detik untuk memahami seberapa besar kami harus mempercayai sidik jari,” tambahnya. “Kami menghitung agregat global dari berbagai sinyal, dan berdasarkan sinyal-sinyal tersebut, model kami dapat secara konsisten dan tepat menandai trafik yang berasal dari bot AI yang berusaha mengelabui sistem.”
Cloudflare bukan perusahaan pertama yang mencoba “bernegosiasi” atas nama pembuat konten. Tahun lalu telah melihat perusahaan seperti ScalePost dan TollBit muncul dan mengusulkan solusi bagi penerbit untuk memantau, menjual, atau memonetisasi data untuk perusahaan AI.
Tetapi pasar Cloudflare yang patut ditiru dapat membuat langkahnya lebih berdampak.
“Jika Anda menggambarkan grup yang berada di posisi terbaik, itu adalah Cloudflare,” kata Gunasekara.
“Sangat penting bahwa kita melihat salah satu langkah besar pertama penerbit berdiri melawan perusahaan. Yang rumit adalah kita tidak tahu apakah perusahaan AI akan menghindarinya,” kata Lily Ray, pakar SEO dan Wakil Presiden di Amsive, dalam sebuah wawancara dengan IBM® Think. Banyak pembuat konten mungkin belum tentu memahami dampak pemblokiran secara default—lagipula, tidak semua orang ingin menghilang dari pencarian AI. “Ini agak berbahaya bagi situs yang tidak mengerti implikasinya,” katanya.
Cloudflare mengatakan penayang dapat memilih untuk mengizinkan crawler mengakses konten mereka untuk pelatihan, pencarian, atau inferensi. Pelanggan yang sudah ada dapat memblokir crawler AI kapan saja dengan satu klik di dasbor Cloudflare mereka.
“Pelanggan dapat membiarkan Cloudflare membuat dan mengelola file robots.txt, yang membuat entri yang sesuai untuk membiarkan perayap tahu untuk tidak mengakses situs mereka untuk pelatihan AI,” Allen menjelaskan. “Pelanggan dapat memilih untuk memblokir bot AI hanya di bagian situs mereka yang dimonetisasi melalui iklan.”
Pertanyaan tentang mengatur pertukaran antara perusahaan AI dan penerbit mungkin mendapatkan banyak cakupan sekarang karena laboratorium AI baru muncul dan investasi mengalir. Tapi itu bukan yang baru, kata Eric Goldman, seorang Profesor Hukum di Santa Clara University School of Law di Silicon Valley, yang mempelajari model “infomediary” selama tahun sembilan puluhan, ketika internet diciptakan.
“Teknologinya mungkin berbeda atau mungkin telah berkembang, tetapi apa yang kita bicarakan hari ini bukanlah hal baru,” katanya kepada IBM® Think.
“Masalah ini telah dibahas selama beberapa dekade, dan belum ada yang berhasil membangun model infomediary, meskipun ada miliaran dolar uang mudah yang dilemparkan untuk masalah itu pada 1990-an. “Jadi, Cloudflare mungkin telah menemukan modelnya; mungkin saja mereka bisa membuatnya bekerja, tetapi rekam jejak historis di bidang ini tidak terlalu bagus.”
Goldman menerbitkan “AI generatif is Doomed”, sebuah makalah tentang topik tersebut, tahun lalu. Menurutnya, tanggapan regulasi dan hukum yang berlaku terhadap AI generatif akan membatasi atau bahkan meniadakan manfaatnya.
Lingkungan hukum masih harus dibentuk oleh hasil dari berbagai tuntutan hukum yang diluncurkan oleh penulis dan penerbit terhadap perusahaan AI besar di AS dan di seluruh dunia. “Sejauh ini, ada alasan untuk meyakini bahwa aturan dasar menyatakan pelatihan model AI generatif menggunakan karya berhak cipta bukanlah pelanggaran. Namun, semua isu ini akan naik banding,” kata Goldman. “Hingga kita mulai mendapatkan putusan dari pengadilan banding, semua itu hanyalah titik data awal.”
