Η
Cloudflare
κυκλοφόρησε ένα νέο δ
ω
ρεάν εργαλείο που εμποδίζει τα bots των εταιρειών τεχνητής νοημοσύνης να συλλέγουν τους ιστότοπους των πελατών της για περιεχόμενο για την εκπαίδευση μεγάλων γλωσσικών μοντέλων. Ο πάροχος υπηρεσιών
cloud
καθιστά αυτό το εργαλείο διαθέσιμο σε ολόκληρη τη βάση πελατών του, συμπεριλαμβανομένων εκείνων με δωρεάν προγράμματα. “Αυτή η δυνατότητα θα ενημερώνεται αυτόματα με την πάροδο του χρόνου καθώς βλέπουμε νέα δακτυλικά αποτυπώματα από προσβλητικά bots που αναγνωρίζουμε ότι σκάβουν ευρέως τον ιστό για εκπαίδευση μοντέλων”, δήλωσε η εταιρεία.
Σε
Ανακοινώνοντας αυτήν την ενημέρωση, η ομάδα του Cloudflare μοιράστηκε επίσης ορισμένα δεδομένα σχετικά με το πώς ανταποκρίνονται οι πελάτες της στην έκρηξη των bots που σκουπίζουν περιεχόμενο για να εκπαιδεύσουν παραγωγικά μοντέλα τεχνητής νοημοσύνης. Σύμφωνα με τα εσωτερικά δεδομένα της εταιρείας, το 85,
2
τοις εκατό των πελατών έχουν επιλέξει να μπλοκάρουν ακόμη και τα bots τεχνητής νοημοσύνης που προσδιορίζονται σωστά από την πρόσβαση στους ιστότοπούς τους.
Το
Cloudflare εντόπισε επίσης τα πιο ενεργά ρομπότ του περασμένου έτους. Το ρομπότ Bytespider που ανήκει στην Bytedance προσπάθησε να αποκτήσει πρόσβαση στο 40 τοις εκατό των ιστότοπων υπό την αρμοδιότητα του Cloudflare και προσπάθησε στο 35 τοις εκατό. Ήταν οι μισοί από τους τέσσερις κορυφαίους ανιχνευτές ρομπότ AI ως προς τον αριθμό των αιτημάτων στο δίκτυο της Cloudflare, μαζί με το Amazonbot και το ClaudeBot.
Αποδεικνύεται πολύ δύσκολο να αποκλειστεί πλήρως και με συνέπεια τα bots AI από την πρόσβαση σε περιεχόμενο. Ο αγώνας εξοπλισμών για την ταχύτερη κατασκευή μοντέλων οδήγησε σε περιπτώσεις εταιρειών να παραβιάζουν ή να παραβιάζουν εντελώς τους ισχύοντες κανόνες σχετικά με το μπλοκάρισμα των ξύστρων. απόξεση ιστοσελίδων χωρίς τις απαιτούμενες άδειες. Αλλά το να έχει μια εταιρεία backend στην κλίμακα του Cloudflare που σοβαρεύει να προσπαθήσει να βάλει το kibosh σε αυτή τη συμπεριφορά θα μπορούσε να οδηγήσει σε κάποια αποτελέσματα.
«Φοβόμαστε ότι ορισμένες εταιρείες τεχνητής νοημοσύνης που σκοπεύουν να παρακάμψουν τους κανόνες για πρόσβαση σε περιεχόμενο θα προσαρμοστούν επίμονα για να αποφύγουν τον εντοπισμό ρομπότ», δήλωσε η εταιρεία. «Θα συνεχίσουμε να παρακολουθούμε και να προσθέτουμε περισσότερα μπλοκ ρομπότ στον κανόνα AI Scrapers and Crawlers και να εξελίσσουμε τα μοντέλα μηχανικής εκμάθησης για να διατηρούμε το Διαδίκτυο ως ένα μέρος όπου οι δημιουργοί περιεχομένου μπορούν να ευδοκιμούν και να ελέγχουν τα μοντέλα που χρησιμοποιείται για την εκπαίδευση του περιεχομένου τους ή εκτελέστε το συμπέρασμα.”
VIA:
engadget.com

0