News

Imscrúdaíonn Amazon Perplexity AI tar éis líomhaintí go ndéanann sé láithreáin ghréasáin a scrapeadh gan toiliú

admin2 days ago

0 0 2 minutes read

Seirbhísí Gréasáin Amazon Tá imscrúdú tosaithe chun a chinneadh an bhfuil Perplexity AI ag sárú a rialacha, de réir Sreangaithe. Le bheith beacht, tá rannán scamall na cuideachta ag féachaint ar líomhaintí go bhfuil an tseirbhís ag baint úsáide as crawler, atá á óstáil ar a freastalaithe, a thugann neamhaird ar Phrótacal Eisiamh Robots. Is caighdeán gréasáin é an prótacal seo, ina gcuireann forbróirí comhad robots.txt ar fhearann ina bhfuil treoracha maidir le cibé an féidir le róbónna rochtain a fháil ar leathanach áirithe nó nach féidir. Is deonach é cloí leis na treoracha sin, ach is gnách go mbíonn meas ag crawlers ó chuideachtaí creidiúnacha orthu ó thosaigh forbróirí gréasáin ag cur an chaighdeáin i bhfeidhm sna '90idí.

I bpíosa níos luaithe, Sreangaithe tuairiscithe gur aimsigh sé meaisín fíorúil a bhí ag seachaint treoracha robots.txt a shuíomh Gréasáin. Rinneadh an meaisín sin a óstáil ar fhreastalaí Amazon Web Services ag baint úsáide as an seoladh IP 44.221.181.252 atá “go cinnte á oibriú ag Perplexity.” Tuairiscítear gur thug sé cuairt ar áitribh eile Condé Nast na céadta uair le trí mhí anuas chun a n-ábhar a scrapeadh freisin. Tá an Caomhnóir, Forbes agus The New York Times gur thug sé faoi deara freisin go raibh sé ag tabhairt cuairte ar a gcuid foilseachán go minic, Sreangaithe dúirt. Chun a dhearbhú an raibh Perplexity ag scríobadh a inneachair i ndáiríre, Sreangaithe iontráil ceannlínte nó cur síos gairid ar a cuid alt i chatbot na cuideachta. D'fhreagair an uirlis ansin le torthaí a athphrasáil go dlúth a chuid alt “le sannadh íosta.”

Le déanaí Reuters d'éiligh tuarascáil go Ní hí perplexity an t-aon chuideachta AI is é sin comhaid robots.txt a sheachaint chun ábhar a bhailiú a úsáidtear chun mionsamhlacha teanga móra a oiliúint. Mar sin féin, is cosúil go bhfuil imscrúdú Amazon dírithe ar Perplexity AI amháin. Dúirt urlabhraí Amazon Sreangaithe go gcaithfidh a chustaiméirí cloí le treoracha robots.txt agus iad ag crawláil láithreáin ghréasáin. “Cuireann téarmaí seirbhíse AWS cosc ar chustaiméirí ár gcuid seirbhísí a úsáid le haghaidh aon ghníomhaíocht mhídhleathach, agus tá ár gcustaiméirí freagrach as ár dtéarmaí agus na dlíthe is infheidhme go léir a chomhlíonadh,” a dúirt siad.

Dúirt urlabhraí na himní Sara Platnick Sreangaithe go bhfuil freagra tugtha ag an gcuideachta cheana féin ar fhiosrúcháin Amazon agus shéan sé go bhfuil a crawlers ag seachaint Prótacal Eisiamh Robots. “Tá meas ag ár PerplexityBot – a ritheann ar AWS – ar robots.txt, agus dheimhnigh muid nach bhfuil seirbhísí atá faoi rialú Perplexity ag crawling ar bhealach ar bith a sháraíonn Téarmaí Seirbhíse AWS,” a dúirt sí. D’admhaigh Platnick, áfach, go ndéanfaidh PerplexityBot neamhaird ar robots.text nuair a chuireann úsáideoir URL ar leith san áireamh ina fhiosrúchán chatbot.

Shéan Aravind Srinivas, POF Perplexity, roimhe seo freisin go bhfuil a chuideachta “gan aird a thabhairt ar Phrótacal Eisiaimh Robot agus ansin ina luí faoi.” D'admhaigh Srinivas Cuideachta Fast go n-úsáideann Perplexity crawlers gréasáin tríú páirtí ar a bharr féin, agus go bhfuil an bot Sreangaithe aitheanta mar cheann acu.

Source link

admin2 days ago

0 0 2 minutes read