Category: Søkemaskiner

Intenet Librarian International 2007 – noen inntrykk

Etter to intense dager i London denne uken har jeg satt meg ned for å oppsummere inntrykkene. Det var en konferanse det var vel verdt å delta på, bare åpningsforedraget av Stephen Abram og avslutningsforedraget til Phil Bradley var verdt både reisen og deltakeravgiften. Det var mye å lære, noen veldig inspirerende foredrag, mange sosiale pauser og mye diskusjon. Etter å ha fordøyd inntrykkene noen dager sitter jeg igjen med en tydelig tanke: Googlenoia – paranoia basert på Google sin raske vekst, økonomiske styrke og enorme effektivitet. Best portrettert gjennom Cory Doctorows novelle Scroogled, omtalt her på bloggen tidligere.

Det ser ut til at dette er en sterkt omseggripende tilstand i bibliotekkretser, og kanskje mange andre steder også, i dag. På konferansen ble det advart mot Googles oppkjøp av diverse tjenester (tydligvis sikler de på Facebook), at de kan skreddersy søkeresultater basert på din tidligere søkeadferd, at de kan ta betalt for å styre deg mot tjenester og søkeresultat og selvfølgelig overvåkning av søk, lesevaner og personlige data, misbruk av disse data etc. etc.

Min første reaksjon blir, dette har jeg da hørt før…, om IBM, Microsoft, arbeiderpartiet, 1984 etc. Joda, vi skal selvsagt være observante og følge med, men sunn skepsis går begge veier, jeg er skeptisk til Google, men minst like skeptisk til Googlenoiaen og konspirasjonstankegangen som ligger til grunn for å tro at Google kan være en fare for individets frihet. Verden er litt mer kompleks enn vi tror, og ikke minst Google selv vet godt hvor svakhetene i systemene deres er. Dessverre er det ikke alle utenfor, og der har kanskje vi bibliotekarer en viktig jobb å gjøre. Ikke disse Google, men saklig og informativt opplyse om svakheter og alternativer.

Scroogled – Cory Doctorow tenker seg en verden der Google er ond

Scroogled er en kort novelle fra Cory Doctorow som tar opp problemstillingen rundt all informasjonen Google etterhvert sitter på om oss alle. Søkehistorie, gmail, blogginnlegg, Orkutnettverk etc. og hvordan dette kan brukes til et overvåkningssamfunn som ville fått George Orwell til å nikke gjenkjennende før han bryter ut i kaldsvette. For oss bibliotekarer som i alle år har virkelig jobbet for å unngå å samle informasjon om brukerene våre må dette være en tankevekker, kan “vår kamp for din private informasjonssikkerhet” være et argument for biblioteket? Eller gir folk beng inntil vi får noen skikkelige skrekkhistorier på forsida av tabloidavisene?

Funnet via mange forskjellige, men først hos Free range librarian 

Tafiti – nytt grensesnitt for søk

Noen ganger er det gøy å oppdage nye søkemotorer. Tafiti er en søkemotor med et visuelt grensesnitt som appelerer til min sans for arkaiske former. Desverre er nok selve søkemotoren under det flotte grensesnittet litt for dårlig til at det blir en aktuell konkurrent til Google, men det står i FAQen at Tafiti er en “experimental search front end”, dvs et eksperimentelt grensesnitt for søk, så om jeg kunne få Tafitis grensesnitt og den søkemotor jeg selv ønsker, da ville det være mer interessant.

Spesielt den flotte tre-visningen var fin, selv om den er mindre funksjonell enn f.eks. Aquabrowser sitt grensesnitt. Dog har den en fullskjermsfunksjon som lett kunne erstatte skjermspareren min. En liten ide til biblioteksystemleverandørene – lag en skjermsparer som viser søkene i katalogen som en visuell og bevegelig funksjon!

Valgmuligheten når det gjelder medieformat, dvs. websøk, bilder, nyheter, bøker (!) og RSS-strømmer er visuelt svært tiltrekkende, og jeg tror at den kan være en lekse for oss i bibliotek om hvordan vi bør tenke i forhold til søk og presentasjon. Om Tafiti blir et grensesnitt for valgfri søkemotor vet jeg at mange bibliotek ville tjene MYE på å få dette istedet for dagens løsninger, alternativt at dagens biblioteksystemleverandører prøver seg på en mer visuell framstilling av søkeresultatene.

En interessant funksjon er stabler (stacks) hvor man kan lager søkeresultat og gruppere dem på høyre side av resultatfeltet. Dette skjer som en dra og slipp funksjon og kan samle alle typer format i en stabel. Nok en funksjon de fleste bibliotekkataloger/grensesnitt ikke har fått til på en god måte. (Nå rår de fleste systemprodusentene neppe over de samme forsknings og utviklingsressursene som Microsoft, men av og til handler det nok også om å få gode ideer og våge å være anderledes).

Min konklusjon er at Tafiti neppe erstatter min vanlige meny av søkemaskiner, men som et friskt innspill i grensesnittutviklingen er den hjertelig velkommen!

Blogging fra Digital Hverdag 2007

Konferansen Digital Hverdag 07 går av stabelen her i Bergen i skrivende stund. Jeg skal prøve å kommentere og referere fortløpende for dette var spennende og bra saker.

Innlederen var Bjørn Kjos fra Norwegian, jeg stilte meg spørsmålet, hva gjør han her, og det ble desverre ikke besvart. Kanskje han var trekkplaster? Han slo fast at Norwegian måtte bruke digita teknologi for å  lykkes, og at de solgte 85% av alle billetter online, og at dette var nødvendig for å holde prisen nede… BOMBE! Det visste ikke jeg, eller resten av forsamlingen fra før, men han er en god og underholdende taler, men jeg følte vel at det var et helt annet publikum dette var rettet mot.

Så kom noen folk fra Microsoft for å fortelle hvor kul hverdagen og arbeidsdagen blir med Vista. Vistademoen var imponerende, for alle som ikke har brukt Apple OS X noen år. Det blir et vell av nye funksjoner og muligheter, og jeg mistenker at kun en brøkdel av brukerene vil ta de fleste av disse i bruk. Nå skal man bruke søk for å finne fram i filene. Når man som bibliotekar vet av erfaring hvor dårlig et stort flertall søker, så tror jeg dette skal bli gøy:-/, men det kan jo tenkes at dette vil tvinge folk til å bli bedre til å søke etter informasjon?

Det som derimot var litt interessant for undertegnede var tidligere moderniseringsminister, nå direktør i IBM, Morten A. Meyers presentasjon. Han sa mye spennende, og var ikke fullt så bedrift- og produktorientert som MS-folka. En av de viktige tingene han nevnte var at i framtiden vil nettet bli tredimensjonalt. Dette ser vi mange eksempler på allerede, det mest kjente og brukte er Second life. BBC skal også lage en virtuell verden for barn, så det skjer mye på dette området. For bibliotek kan det jo være interessant å vite at det finnes flere bibliotek i Second Life, og at de er sposet av to av de store systemleverandørene. Kanskje noe å kikke på for norske bibliotekarer også? Det er vanligvis svært stille i Second Life på norsk dagtid, så det kunne jo være en grunn til å live det opp med litt norsk nærvær.

Etter Meyers presentasjon kom sjefen for SESAM.no, den norske søkemaskinen som skal konkurrere med Google. Grunnen til at de tror de kan lykkes er at alle søk er lokale. De fleste søk gjort i Norge har norsk innhold som mål. Han hadde mange gode poenger, og strategien inponerer. Jeg kommer nok til å bli en mer aktiv bruker av SESAM.no etter dette. En annen ting var at han la stor vekt på Nasjonalbiblioteket som leverandør av digitalt innhold til SESAM. Det bekymret meg litt. Vil SESAM bli den eneste inngangen til innhold som NB produserer? Det håper jeg ikke blir tilfelle. Uansett ser det ut til at SESAMS strategi om å fokusere på verdiøkning og indeksert innhold er en god ide. Synd ikke bibliotekene tok den ideen når vi var de eneste som egentlig holdt på med dette. Tanker rundt innholdssiden er spennende og det kommer mer om dette senere.

How to out-google Google!

Dette var en av mine favorittuttrykk fra Marydee Ojala (redaktør av Online magazine) sitt foredrag i Bergen for to uker siden. Hun gikk gjennom rikets tilstand når det gjelder søking, og viste oss med effektive og enkle midler hvordan vi alle kan bli vesentlig bedre til å søke etter informasjon på nett, og hvordan vi kan posisjonere oss i forhold til den generelle holdningen: “Google finner alt.”

Foredraget fikk jeg tatt opp og skulle ha publisert på Bibliotek 2.0 podcast, men pga tekniske problemer legger jeg fordraget ut som en vanlig MP3 fil, og så får den offisielle podcasten komme når den kommer:-). Foredraget blir delt opp i tre deler slik at det blir mulig å høre uten å belaste tidsbudsjettet og båndbredden for mye.

Jeg vil takke NOLUG og NFF for at de klarte å få Marydee til Norge.

Presentasjonen fra foredraget finnes på NOLUG sine sider. (OBS! Dette er en powerpointfil!)

Ms. Dewey

Fru eller frøken Dewey er navnet på en søkemotor som “underholder” deg mens søket pågår. Den er utrolig treig på selve søkingen, men underholdende mens man venter, første gangen du prøver, etter det blir den stort sett irriterende. Og det som irriterer meg mest er selvfølgelig navnet. Damen er sexy nok, men oppførselen hennes er langt fra det vi kan kalle et referanseintervju/skranke ideal. OG med navnet Dewey må jo dette knyttes til bibliotek.

Google støtter leseopplæring?

Google har laget et nettsted The Literacy Project i samarbeid med bl.a. UNESCO. Nå kommer 1.000 kroners spørsmålet, hvorfor? Såvidt jeg kan se er dette en portal der man får tilgang til å søke i åpne ressurser om leseopplæring/oppmuntring i de forskjellige Googlemiljøene som finnes, f.eks. Google video, Google scholar og book search, og ikke minst Blogger. Det er altså en avgrensning av tilgang til eventuelt tilgjengelig materiale, f.eks. får man ikke tilgang på YouTube-materiale om samme tema, eller tilgang til fulltekst (slik mange bibliotek tilbyr) på materiale man finner i Google Scholar. Altså, en ny frustrasjonsfaktor heller enn en ny hjelp i leseopplæringen. Etter min mening en tabbe av UNESCO å alliere seg med Google. De kunne helt sikkert laget en egen portal (kanskje ikke med like mye oppmerksomhet, så det er vel en av genvistene ved å alliere seg med Google), og heller gitt en oversikt over tilgjengelig materiale fra alle kilder.

Google søker i nasjonalbibliografier

I Googles egen blogg finner vi idag et innlegg om hvordan Google Scholar nå inkluderer søk i nasjonalbibliotekene i Ungarn, Island, Israel, Portugal, Sverige og Sveits.

Skikkelig spennende saker, og et stort steg framover for å gjøre bibliotekenes kataloger mer tilgjengelig og nyttige for brukerene. Når får vi Nasjonalbiblioteket på banen?

Tillegg 22. februar: Har, etter råd i en kommentar fra Magnus Enger, prøvd å få legge til Bibsys, som kommer opp når man søker i Scholar instillinger, men den lar seg ikke legge til. Kan det være at man må tilhøre et Bibsysbibliotek for å få dette til?

Thomas

Fant referansen til denne på Biblioteksbilagan

Google og medisin.

British Medical Journal (BMJ) har en fersk artikkel om “How Google is changing medicine“. Den tar utgangspunkt i at stadig flere pasienter bruker Google som grunnlag for å finne ut mer om egne sykdommer og ofte å finne diagnosen (eller det de tror er en diagnose). BMJ tar opp den tråden og diskturere hva Google gjør, blant annet med vitenskapelig informasjon i Google Scholar og oppfordrer Google til å lage en spesiell portal for medisinsk informasjon.

Som en personlig kommentar vil jeg si at jeg ikke er overbevist om Google er rette til å gjøre noe slikt. Google er basert på automatisert utvelgelse og indeksering, og er det noe sted man trenger menneskelig kvalitetskontroll så er det innen medisinsk informasjon. Det flommer over av kvasimedisin på veven, og databaser som Elseviers Scirus som skal inneholde utvalgte vevsteder er ikke fri for dette, se min kommentar om denne basen.

Men BMJ artikkelen er interessant og viktig og har mange gode referanser til andre artikler og vevsteder, den bør leses og studeres.

Takk til Anita Haukvik som tipset meg om dette.

Even

Artikler i Bibliotekforum og Bok og Bibliotek

Jeg håper dere tilgir meg litt egenreklame her. De siste åreme har jeg skrevet i Bibliotekforum og Bok og Biliotek. En del tilbakemeldinger tyder også på at de blir lest. Takk for dem! Jeg har laget en liten side med oversikt over artiklene og lenker til dem, adressen er http://home.broadpark.no/~evflood/artikler.html Håper noen kan ha nytte av den.

Even

Nytt om Open WorldCat

Open WorldCat er OCLCs samarbeide med Google og Yahoo! om å legge ut hele Worldcat katlogen som en del av søkemaskinene til Google og Yahoo!, så alle kan søke i katalogen. Arbeidet er i gang, men foreløpig er det bare en liten (?) del av katalogen som er åpen. Planen er å få alt ut, men reperesentantene for OCLC på IFLA møtet i Oslo i August kunne ikke si hvor fort det vil skje.

Men OCLC har kommet med en nyhet: Det er blitt mulig for alle brukere å legge inn kommentarer, innholdsfortegnelse eller anmeldelse av bøkene. Når en katalogpost fra OCLCs worldcatlibraries.org kommer opp kan man klikke på “details” eller “reviews” og få opp menyen for å legge inn informasjonen. Man må registrere seg som bruker, men det er ganske enkelt.

For å søke i Open WorldCat må man skrive inn søkeordene i Yahoo! eller Google og begrense søkningen til domenet: worldcatlibraries.org. Det gjør man i avansert søk. Det er også laget hjelpemidler for å forenkle dette og søke direkte, de kan man hente fra OCLC. Det er verktøylinjer for å søke i både Yahoo! og Google. Personlig har jag lagt opp de to hjelpemidlene for Firefox. Google og Yahoo! gir forskjellig resultat, det virker som i skrivende stund er det Google som har lagt inn flest poster.

Med takk til Lorcan Dempsey som på sin blog la ut informasjon om denne utvidelsen.

Er det ikke størrelsen det kommer an på?

De som var inne på Google i går (27/9) la kanskje merke til noe spesielt. Det ene var logoen med syv kakestykker for å feire Googles fødselsdag, syv år. Men det var en liten forandring til, mye mer betydningsfull: Tallet som viste hvor mange sider Google indekserer var forsvunnet. Det er riktig – Google har avblåst søkemaskinkrigen, størrelsen på databasen er ikke lenger viktig. Hvem bryr seg om Google indekserer 8-9 milliarder sider eller Yahoo! sier de har over 19 milliarder objekter, og hva er det egentlig man snakker om?

Siden søkemaskinene startet har størrelsen vært vesentlig, konkurransen har vært hard og brukerne fulgte med spenning mens titals millioner vevsider ble til hundretalls millioner og så til milliarder, og så til flere milliarder. Det siste store spranget i krigen var torsdag 10 november 2004 da Microsoft lanserte MSN Search med ca 4 milliarder sider og Google fordoblet sin database til over 8 milliarder samme dag, et kupp mente mange. Men til ergrelse for andre, spesielt undertegnede som hadde kurs dagen etterpå og opplevde det forsmedelige at viktige data ble foreldet dagen før kurset.

Men nå er altså den krigen avblåst etter at stadig flere sier at størrelsen ikke har noe med saken å gjøre, det er relevansen som er det viktige. Danny Sulllivan har en god artikkel om dette i Searchenginewatch.

Så er dette en God Ting? Kanskje, kanskje ikke. Størrelsen i seg selv var ikke så viktig, men det var et indikator for hvor omfattende den dekket mindre steder på nettet, for eksempel norske vevsider. Og mange bruker mulghetene Google har for å avgrense til lokale internettsteder til å søke i alle sidene til et bestemt nettsted. Størrelsen på søkemaskinen gir en indikasjon på hvor grundig det blir gjort. Men bare en indikasjon. Og det er så mange usikkerheter og definisjonspørsmål knyttet til krigen om størrelsen at det kanskje er vel så greit å si med Gershwin brødrene: “Let’s call the whole thing off”.

Even

Søkemaskiner er ikke alltid enkle

Det er ikke alltid enkelt å skrive om Internett og søkemaskiner. I en artikkel i Bok og Bibliotek, nr 4 skrev jeg om søkemaskiner som grupperer søkeresultater etter innhold (clustere), spesielt roste jeg søkemaskinen Clusty og skrev dette:

Et eksempel jeg prøvde var å søke på søtningsmidlet aspartam som blant annet finnes i lettbrus og utallig andre produkter som skal gjøre livet lett for oss. Det foregår en intens kampanje mot dette midlet på nettet for å overbevise oss om at det er livsfarlig og roten til alt ondt. Så hvordan vil Clusty behandle noe så kontroversielt? Utrolig bra, den greide å samle en rekke sider under headingen ” Safety Of Aspartame” som alle var rapporter om at giftvirkningene er, for å si det mildt, overdrevet.

Dette var riktig da jeg skrev det i mai, og det var riktig da jeg prøvde det ut tidlig i juni. Men til min store gremmelse ble ikke et slikt cluster dannet i det hele tatt da jeg skulle demonstrere dette online på et kurs jeg hadde i Grimstad i midten av juni. Jeg har siden forsøkt flere ganger, av og til (som for tre dager siden) fungerte det glimrende, idag (26/9/2005 kl. 11.30 – for å være helt presis) fungerte det ikke igjen. Så antagelig bør alt man skiver om søkemaskiner ha dato og tid føyet til for å være på den sikre siden. Og til alle som leser artikkelen min, sett til ordene “av og til” foran ordene “utrolig bra” i sitatet over!

Even

Google Print saksøkt av forfattere

Google Print har helt siden Google annonserte prosjektet blitt meget diskutert og omdiskutert. Siste utvikling er at amerikanske Authors Guild har saksøkt Google for brudd på opphavsretten, de hevder bare forfatterne har rett til å bestemme hvor og når deres arbeider skal kopieres. Tidligere har Google hatt problemer med forskjellige universitetsforlag. Google har lagt ut et svar på sin egen blog.

Et forum hvor Google Print er blitt mye diskutert er på postlisten Web4lib, for å se diskusjonen kan man gå til arkivene og søke på ordene google print.

Even

Google med blogsøking

Google har lansert enda en ny søkemaskin, denne gangen for blogger. Adressen er http://blogsearch.google.com/ og den er, som (nesten) alle av Googles seneste produkter, i beta-versjon. Den søker bloggene i full tekst, men også med mulighet til avgrensing til navnet på bloggen og til spesifikke blogger eller rettere, til spesifikke adresser, men det vil vel stort sett bety det samme.

Den nye søkemaskinen er naturlig nok kommentert, ikke minst på mange blogger, søk på ordene google blogsearch i denne søkemaskinen for kommentarer.

Det er forøvrig mange aktører i dette markedet, kanskje den viktigste effekten med Googles initiativ er å gjøre oppmerksom på dette. Open Directory har en egen kategori for søkemaskiner for blogger.

Til slutt, Blogg og Bibliotek er med i Google blogsearch.

Even