Automattic, tvrtka koja stoji iza toga WordPress i Tumblr, pregovara o unovčavanju korisničkog sadržaja prodajom svojih podataka AI tvrtkama, uključujući MidJourney i OpenAI. Ovi podaci s blogerskih platformi Tumblr i WordPress.com će se koristiti za obuku modeAI.
Iako su detalji transakcije još uvijek nejasni, vijest je izazvala zabrinutost među korisnicima o potencijalnoj zlouporabi njihovog privatnog sadržaja na dvjema blogerskim platformama. 404 Media također sugerira da su interni sukobi nastali unutar Automattic jer je prikupljeni sadržaj uključivao privatne podatke koji nisu bili namijenjeni zadržavanju unutar tvrtke.
Kao odgovor na reakciju, Automattic je spreman uvesti novu značajku koja će korisnicima omogućiti da odustanu od dijeljenja svojih podataka za obuku AI-ja. Tvrtka u objavi na blogu potvrđuje svoju predanost pružanju korisnicima Tumblr-a i WordPress veća kontrola nad njihovim sadržajem. Spominje se pokretanje postavke za "obeshrabrivanje istraživanja AI tvrtki", objašnjavajući da su vodeće AI istraživačke platforme blokirane prema zadanim postavkama.
Problem korištenja sadržaja s blogova od strane tvrtki koje razvijaju AI modele nije ograničen samo na platforme kojima upravlja tvrtka Automattic. toliko toga OpenAI Poput Googlea, koristi alate za indeksiranje koji prikupljaju informacije sa svih stranica za treniranje modela umjetne inteligencije. Proces je sličan prikupljanju podataka putem tražilica.
Kako možete blokirati OpenAI i Gemini (Bard) uzeti podatke sa tvog bloga?
Ako posjedujete blog ili web stranicu i ne želite da se podaci s njih koriste za treniranje modela umjetne inteligencije OpenAI i Gemini, alatima za indeksiranje možete onemogućiti pristup vašem sadržaju. Ovo ograničenje može se postaviti putem datoteke robots.txt
.
OpenAI Crawlers
User-agent: GPTBot
Disallow: /
Gemini Crawlers
User-agent: Google-Extended
Disallow: /
Nakon što spremite datoteku robots.txt s novim redcima, idite na Google konzolu na: Settings > robots.txt > kliknite na izbornik s tri točkice, kliknite "Request a recrawl".
Povezano: GPT-5 i novi web crawler GPTBot razvijen od strane OpenAI.
Za korisnike Tumblr-a i WordPress, pristup dohvaćanju podataka s blogova putem OpenAI ili druge tvrtke za razvoj umjetne inteligencije, moći će se blokirati pomoću alata koje je stavila na raspolaganje tvrtka Automattic.