19. I “motori di ricerca”

Post scriptum – ottobre 2012

Questa pagina era stata scritta quando era all’inizio lo sviluppo di Google,
che poi è cresciuto fino a diventare il search engine per antonomasia.
Ma è interessante constatare che pochi dei “motori di ricerca”
citati nel 1998 oggi risultano scomparsi o “non più attivi”.
Molti sono ancora disponibili – e se ne sono aggiunti parecchi altri.

 

  Se non abbiamo già gli indirizzi dei "siti" che vogliamo visitare, spesso non è facile trovare ciò che cerchiamo.

Possiamo partire da indirizzi pubblicati su libri e riviste – o segnalati in liste di discussione o messaggi in rete. È molto utile il più semplice e il più antico dei sistemi: chiedere a un amico se conosce il terreno che desideriamo esplorare. Non meno utile è frequentare forum o liste di dialogo in cui si trattano gli argomenti che ci interessano, dove spesso possiamo trovare segnalazioni utili.

Uno dei modi per allargare la nostra ricerca è usare i link, cioè le connessioni che un "sito" ci offre per collegarci direttamente ad altri che trattano argomenti simili o che il gestore di quel sito considera degni di attenzione. Queste connessioni sono uno dei servizi interessanti offerti dalla Web. Quando abbiamo trovato un website affidabile e adatto alle nostre esigenze, una parte della ricerca si può svolgere seguendo la gerarchia dei link in quel sito e in quelli cui è connesso.

Purtroppo l’abbondanza di link non è sempre un bene. Alcuni "siti" sembrano essere fatti solo di una scelta, più o meno soggettiva, di link; e non sempre gli indirizzi sono aggiornati. Altri offrono link non sulla base di una loro valutazione critica, ma con criteri commerciali (cioè su una base di scambio; o, più brutalmente, facendosi pagare per portare "traffico" a qualcun altro). Con l’esperienza e l’esplorazione non è difficile capire quali sono le "fonti" più interessanti e più adatte alle nostre esigenze.

Se vogliamo esplorare le fonti disponibili su un argomento che ci interessa, spesso i link non sono sufficienti: dobbiamo perciò usare strumenti di esplorazione, i cosiddetti "motori di ricerca" (search engine), che ci permettono di fare una ricerca per argomento. Ce ne sono molti; alcuni "generali", altri più specializzati. Alcuni raccolgono indiscriminatamente il maggior numero possibile di dati, altri seguono criteri più selettivi.

Si sta diffondendo una certa perplessità sull’efficacia di questi sistemi. La massa di materiale da esplorare è così ampia che difficilmente i criteri di analisi corrispondono alle aspettative di chi sta cercando informazioni su un argomento. Ma se possono deludere chi si aspetta miracoli, sono tuttavia strumenti utili quando non si hanno canali più diretti per trovare ciò che cerchiamo. Perciò è utile conoscere almeno i più importanti, come per esempio:

È considerato il "nonno" dei molti search engine disponibili oggi. Ha una base di dati molto ampia; forse è il più "grosso" in assoluto, perciò poco selettivo. Basato sulla "forza bruta", contiene un’enorme quantità di dati; con una richiesta generica si riceve un numero esagerato di indicazioni, che possono contenere anche "doppioni". Per ovviare a questo problema, sta introducendo nuovi metodi di ricerca più "raffinati". Può essere utile nel caso di ricerche "disperate", cioè che non trovano risposta con altri "motori"; o in abbinamento con un altro servizio più selettivo. Per la ricerca di libri, si connette con Barnes & Noble. Se ci si collega dall’Italia, Lycos si presenta automaticamente con un’interfaccia in italiano; da questa pagina è possibile, volendo, scegliere di restringere la ricerca solo all’Italia. Lycos ha homepage analoghe anche in francese, tedesco, spagnolo, olandese e svedese.

È un altro search engine gigantesco; molti lo considerano il migliore fra i sistemi a base estesa. Potente e tecnicamente avanzato, con interessanti possibilità di configurazione sia della ricerca, sia della presentazione dei risultati. Ha un patrimonio di dati molto ricco: afferma di essere "la più grande guida della Web", con capacità di ricerca estesa anche sui gruppi di notizie e discussione Usenet. Per i libri si collega ad Amazon Books. Il suo sistema di ricerca è efficiente; fra l’altro permette di fare scelte per periodo di tempo o per lingua, e così ridurre il campo di esplorazione. Può essere lo strumento migliore per chi preferisce usare un solo "motore di ricerca".

È il search center di Wired (offre anche un accesso alle pagine della rivista). È uno dei servizi più potenti ed efficaci: forse meno conosciuto di AltaVista o Lycos, ma con prestazioni non inferiori. Ha una base estesa e un buon sistema di ricerca; permette di restringere l’ambito per periodo e per area geografica. Offre anche recensioni di siti raggruppati per argomento.

È probabilmente il più "classico" dei sistemi di esplorazione; esiste fin dalle origini della rete. Non è un vero e proprio "motore di ricerca", ma piuttosto un’antologia, divisa per argomenti e settori; se lo si usa come search engine utilizza AltaVista. Non ha una base di dati eccezionalmente vasta, perché fa una scelta dei "siti" che decide di censire; in compenso offre un’ottima scelta ragionata degli indirizzi. Può non essere lo strumento ideale per ricerche molto "mirate"; invece è considerato utile per ottenere una prima lista di "siti caldi" da cui cominciare l’esplorazione di un nuovo territorio. Offre la possibilità di usare automaticamente, oltre ad AltaVista, anche altri "motori" come WebCrawler, HotBot, Lycos, Infoseek ed Excite. Ha interfacce in molte lingue; dall’aprile 1998 anche in italiano con l’intenzione di non essere solo un accesso al reperrtorio internazionale ma anche una "scelta ragionata" di siti italiani. Ci vorrà tempo, perché il processo di selezione usato da Yahoo richiede un intervento umano; quindi può essere più raffinato ma è inevitabilmente più lento dei sistemi automatici.

È una guida della rete, più selettiva che estesa; per la ricerca su basi ampie offre un potente sistema chiamato Ultraseek Oltre che sulla Web offre ricerche su Usenet, su notiziari e su un catalogo di imprese. Ha una funzione find similar che, una volta individuato un "sito" interessante, permette di cercarne altri "simili" (ma il suo concetto di "analogia" può rivelarsi alquanto diverso dal nostro). Offre interfacce in molte lingue, fra cui l’italiano (Infoseek Italia propone anche una connessione a Virgilio.

Ha una base estesa, ma non così vasta come i "giganti". Come Infoseek, ha una funzione di ricerca "per analogia"; ma anche in questo caso i criteri sono spesso diversi da quelli che ci interessano. Offre anche ricerca sui gruppi Usenet tramite Deja News. Ha interfacce in francese, tedesco, svedese e olandese, ma non in italiano.

Era uno dei servizi più noti, ma è un po’ in decadenza. Non ha una base di ricerca ampia e può dare risultati deludenti; per accedere a una risorsa più estesa si collega con Excite. Come Lycos, per i libri si connette a Barnes & Noble.

Non è uno dei sistemi più comunemente usati e non ha una base molto ampia; contiene recensioni dei siti che considera più interessanti. I sommari dei contenuti dei siti selezionati sono spesso ben fatti. Ha la funzione find similar, come Excite e Infoseek – e con gli stessi limiti. Ha anche una funzione "luce verde" per segnalare solo i siti che considera adatti a essere visti da "tutti". Offre l’estensione della ricerca a Excite e WebCrawler.

Non ha una base molto vasta, nè un sistema di ricerca particolarmente raffinato, ma è rapido ed efficiente. Offre l’opzione find similar che, come negli altri servizi con funzioni analoghe, non è molto utile.

Non è un "motore di ricerca" ma un catalogo di imprese. Nel suo genere, efficiente, ma orientato soprattutto agli Stati Uniti.

Ci sono anche "motori" specialistici, come:

 

Per la ricerca su giornali, riviste, notizie d’agenzia e altri testi (è a pagamento, ma offre un accesso gratuito per 30 giorni).

Per l’esplorazione degli archivi pubblici Usenet cercando articoli per autore, titolo e data.

Per trovare nomi e indirizzi e-mail (corregge automaticamente errori di ortografia e permette la ricerca per iniziali). Ha interfacce in francese e spagnolo, ma non in italiano. Un altro sistema per la ricerca di indirizzi e-mail (con una base informativa estesa, ma non sempre precisa) è Four11 (che ora è di proprietà di Yahoo e accessibile anche da quel sistema).

 

È la risorsa più nota er la ricerca di software in rete. Ci sono anche altri servizi come Filez e Download.

Nel caso di software per Windows (e per Macintosh e OS/2) c’è una vasta offerta su Tucows che offre anche un’ampia scelta di mirror in Italia, come quelli su Thebrain,   Tin, Village, McLinkItalia Online e parecchi altri.

 

Ci sono servizi che offrono un’interfaccia Web anche per la "classica" funzione internet Archie per l’esplorazione degli archivi FTP (File Transfer Protocol). Fra questi Archieplex che, conoscendo i nomi dei file (o parti di essi), permette di identificare i siti FTP in cui si trovano. Altri servizi Archie sono elencati su Nexor.

Con FTP Search si possono cercare i file nei server FTP; un servizio rapido e potente, con un’ampia scelta di metodi per "personalizzare" la ricerca e renderla più selettiva.

Questo elenco è tutt’altro che completo; esistono molti altri "motori di ricerca", come per esempio Galaxy, OpentextThunderstone, Go2,   What-u-seek. Ce n’è perfino uno che si chiama Mamma. Censirli tutti è praticamente impossibile. Tutto il sistema è in continua evoluzione. I servizi cambiano, si arricchiscono (talvolta si impoveriscono, specialmente se mancano di aggiornamento); spesso nascono cose nuove.

Un elenco di "motori di ricerca", con descrizioni e commenti, si trova su Uncor.edu.

 

Ci sono anche "motori dei motori" (meta research tool) che consultano diverse risorse:

  • Dogpile
    Usa 14 search engine e può fare ricerca anche su Usenet, FTP e notiziari.

Altri sistemi come AccuFind, Starting Point, On The Web non sono "metamotori" automatici ma propongono una gamma di risorse fra cui scegliere. A questa categoria appartiene anche Beaucoup! che offre link a 800 strumenti di ricerca e repertori.

Esistono elenchi e "motori di ricerca" specificamente italiani. Ce n’era stata una proliferazione abbastanza confusa, ma oggi molti sono scomparsi o in estinzione. È impossibile elencarli tutti, anche perché non sempre è facile distinguere fra i molti siti che offrono una serie più o meno soggettiva di link e quei servizi che operano in modo più sistematico.

I due più grossi (e relativamente recenti) "motori" italiani sono:

Oltre a gestire la ricerca sui siti italiani permette collegamenti diretti a "motori" internazionali, come Altavista, Yahoo, Excite, Magellan, Lycos e Infoseek. Offre anche un servizio di ricerca sui "giornali di oggi" e una "rassegna stampa" in abbonamento.

Si propone con intenzioni ambiziose e si vanta dei suoi "allori", ma non è molto efficiente. Offre ricerca internazionale con Infoseek. Il nome di questo "motore" tradisce una cultura un po’ bizzarra della rete... se la guida si chiama Virgilio, ciò che ci aspetta sono i gironi dell’inferno?

Altre due risorse interessanti sono:

Un "motore" italiano non molto noto, ma ben impostato ed efficiente.

Offre link diretti ai principali search engine internazionali e italiani, con suggerimenti su come svolgere le ricerche e una serie di notizie e curiosità.

I più vecchi (e più piccoli) repertori italiani sono in declino; molti hanno cessato di esistere, o sono in abbandono. Fra i sopravvissuti:

Qualche tempo fa era fra le principali risorse italiane di ricerca; esiste ancora ma sembra avere una base non molto estesa e poco aggiornata.

Cineca

non è un "motore di ricerca" ma offre "informazioni classificate per discipline".

È un un repertorio di siti italiani suddivisi per argomento, mantenuto dal CNR di Milano.

È un piccolo "motore di ricerca" per settori (15 categorie) e anche con "parole chiave". Ha una base di dati ristretta e poco aggiornata.

Sembra aver rinunciato a operare come "motore"; offre link ad Arianna, Virgilio, Altavista, Lycos, SavySearch e Shareware.com

Si presenta come search engine ma ha prestazioni molto modeste, sia per qualità della ricerca sia per dimensioni e aggiornamento.

Non è un motore di ricerca in sé ma offre collegamenti a MetaSearch, AltaVista, Excite, HotBot, Infoseek, Shinyseek, Yahoo, Lycos e WebCrawler.

È un catalogo di siti aziendali italiani; ricerca in 41 categorie o per nome.

In pratica, almeno come inizio, la soluzione più semplice è usare Arianna (con i relativi link internazionali) o andare direttamente sui grandi search engine americani come AltaVista, HotBot o Ultra-Infoseek – o su repertori meno estesi ma più analitici, come Yahoo.

Nell’uso dei "motori di ricerca" (specialmente in quelli con basi molto estese) occorre scegliere con cura la parola, o combinazione di parole, da usare come "chiave" di definizione dell’argomento che vogliamo esplorare. Un errore anche minimo di ortografia può provocare un fallimento. Una definizione troppo generica può trovare un numero esagerato di indirizzi, fra i quali poi è difficile individuare quelli che ci interessano. Spesso è utile provare con diversi sinonimi per verificare quale ci porta più vicino al nostro obiettivo.

È bene ricordare che le parole brevi, se usate da sole, non sono buoni strumenti di ricerca, perché possono portare facilmente a "trovare" anche parole più lunghe che contengono quei caratteri. Per esempio una ricerca con "astro" può perdersi in un mare di 50.000 documenti; e trovare non solo tutto ciò che parla di astronomia, astrologia, astrofisica o astronautica, ma anche giochi e altre cose non attinenti al tema che ci eravamo proposti.

Quasi tutti i grandi search engine permettono l’uso di combinazioni di parole per restringere il campo di ricerca; ma è meglio verificare, perché i vari sistemi usano sintassi diverse. I testi di help di ciascun programma possono aiutare a capire quali formule sono più efficienti.

 

   
 
Giancarlo Livraghi

 

 
precedente ritorno all'indice successivo

 

Home Page Gandalf
home