Η Amazon Web
Services
έχει ξεκινήσει έρευνα για να διαπιστώσει εάν το
Perplexity
AI παραβαίνει τους κανόνες της, σύμφωνα με
Ενσύρματο
. Για την ακρίβεια, το τμήμα cloud της εταιρείας εξετάζει ισχυρισμούς ότι η υπηρεσία χρησιμοποιεί έναν ανιχνευτή, ο οποίος φιλοξενείται στους διακομιστές της, που αγνοεί το Πρωτόκολλο Εξαίρεσης Ρομπότ. Αυτό το πρωτόκολλο είναι ένα πρότυπο ιστού, όπου οι προγραμματιστές τοποθετούν ένα αρχείο robots.txt σε έναν τομέα που περιέχει οδηγίες σχετικά με το εάν τα bots μπορούν ή δεν μπορούν να έχουν πρόσβαση σε μια συγκεκριμένη σελίδα. Η συμμόρφωση με αυτές τις οδηγίες είναι εθελοντική, αλλά οι ανιχνευτές από αξιόπιστες εταιρείες τις σέβονται γενικά από τότε που οι προγραμματιστές ιστού άρχισαν να εφαρμόζουν το πρότυπο στη δεκαετία του ’90.
Σε παλαιότερο κομμάτι,
Ενσύρματο
έχουν αναφερθεί
ότι ανακάλυψε μια εικονική μηχανή που παρακάμπτει τις οδηγίες robots.txt του ιστότοπού της. Αυτό το μηχάνημα φιλοξενήθηκε σε έναν διακομιστή υπηρεσιών Web της Amazon χρησιμοποιώντας τη διεύθυνση IP 44.221.181.252 που “ασφαλώς λειτουργεί από το Perplexity”. Σύμφωνα με πληροφορίες, επισκέφτηκε άλλες ιδιοκτησίες του Condé Nast εκατοντάδες φορές τους τελευταίους τρεις μήνες για να σκουπίσει το περιεχόμενό τους.
ο
Κηδεμόνας
,
Forbes
και
Οι Νιου Γιορκ Ταιμς
το είχαν επίσης εντοπίσει επισκεπτόμενος τις δημοσιεύσεις τους πολλές φορές,
Ενσύρματο
είπε. Για να επιβεβαιώσουμε εάν το Perplexity όντως έγραφε το περιεχόμενό του,
Ενσύρματο
εισήγαγε τίτλους ή σύντομες περιγραφές των άρθρων της στο chatbot της εταιρείας. Στη συνέχεια, το εργαλείο απάντησε με αποτελέσματα που παρέφραζαν προσεκτικά τα άρθρα του “με ελάχιστη απόδοση”.
Πρόσφατο
Reuters
Η έκθεση ισχυρίστηκε ότι η Perplexity
δεν είναι
η μόνη εταιρεία τεχνητής νοημοσύνης που παρακάμπτει τα αρχεία robots.txt για να συγκεντρώσει περιεχόμενο που χρησιμοποιείται για την εκπαίδευση μεγάλων γλωσσικών μοντέλων. Ωστόσο, η έρευνα της Amazon φαίνεται να επικεντρώνεται μόνο στο Perplexity AI. είπε εκπρόσωπος της Amazon
Ενσύρματο
ότι οι πελάτες του πρέπει να συμμορφώνονται με τις οδηγίες του robots.txt κατά την ανίχνευση ιστοτόπων. «Οι όροι παροχής υπηρεσιών της AWS απαγορεύουν στους πελάτες να χρησιμοποιούν τις υπηρεσίες μας για οποιαδήποτε παράνομη δραστηριότητα και οι πελάτες μας είναι υπεύθυνοι για τη συμμόρφωση με τους όρους μας και όλους τους ισχύοντες νόμους», ανέφεραν.
είπε η εκπρόσωπος του Perplexity, Sara Platnick
Ενσύρματο
ότι η εταιρεία έχει ήδη απαντήσει στα ερωτήματα της Amazon και αρνήθηκε ότι οι ανιχνευτές της παρακάμπτουν το Πρωτόκολλο Εξαίρεσης Ρομπότ. “Το PerplexityBot μας — το οποίο εκτελείται σε AWS — σέβεται το robots.txt και επιβεβαιώσαμε ότι οι ελεγχόμενες από το Perplexity υπηρεσίες δεν ανιχνεύονται με κανέναν τρόπο που παραβιάζει τους Όρους Παροχής Υπηρεσιών του AWS”, είπε. Ο Platnick παραδέχτηκε, ωστόσο, ότι το PerplexityBot θα αγνοήσει το robots.text όταν ένας χρήστης περιλαμβάνει μια συγκεκριμένη διεύθυνση URL στην ερώτησή του για chatbot.
Ο
Aravind Srinivas
, ο Διευθύνων Σύμβουλος της Perplexity, αρνήθηκε επίσης προηγουμένως ότι η εταιρεία του “αγνοεί το Πρωτόκολλο αποκλεισμών
ρομπότ
και στη συνέχεια λέει ψέματα γι’ αυτό”. Ο Σρινίβας το παραδέχτηκε
Fast Company
ότι το Perplexity χρησιμοποιεί ανιχνευτές ιστού τρίτου μέρους πάνω από το δικό του και ότι το bot
Ενσύρματο
που ταυτοποιήθηκε ήταν ένας από αυτούς.
VIA:
engadget.com

0