Да ли је Гугл добар за историју?

Док Гугл редовно користи своју моћ да радикално мења тржишта, нетипично је благ у нападима на режим интелектуалне својине и његове корпоративне браниоце. Гугл књиге могу да се читају код куће, у пиџами, али то није довољно.

[Ово су белешке које је аутор припремио за своје излагање на годишњем састанку Америчког удружења историчара 7. јануара 2010. у Сан Дијегу. Панел дискусија под називом „Да ли је Гугл добар за историју?“ садржала је и предавања Пола Дугуда са Универзитета Беркли у Калифорнији и Брендона Беџера из Гугл књига (Google Books).]

Да ли је Гугл добар за историју? Наравно да јесте. Ми као историчари тражимо и процењујемо доказе. Гугл је вероватно најмоћнија алатка у људској историји баш за такву врсту посла. Он је пронашао наизглед једноставан начин да се у секунди прегледају милијарде докумената и потрошио стотине милиона долара сопственог новца да би нам омогућио да читамо милионе књига у својим пиџамама. Да ли је Гугл „добар”? Шта кажете за „сјајан”?

Али, опет, ми историчари смо, као и други који се баве хуманистичким наукама, по својој природи настројени критички. Ми готово свему можемо наћи ману. А ова наша нарав постаје још жешћа, што не би требало нимало да чуди, када нека велика компанија, коју већим делом чине боље плаћени дипломци с друге стране кампуса, силом уђе на нашу територију. Да је Гугл потрошио стотине милиона долара на изградњу библиотеке Вајднер на Харварду, сигурно бисмо се жалили на све оне степенице које воде до главног улаза.

Једним делом из страха, а другим из зависти, лако је критиковати Гугл. Док сваке друге недеље, чини се, излази по једна опсесивна књига о Гуглу, где су критичке књиге о ПроКвесту или Елсевиру или другим великим информационим компанијама које услужују академско тржиште на проблематичне начине? Ове компаније, које такође пружају услуге претраживања и дигиталног скенирања, наплаћују универзитетима превелике суме за привилегију приступа. Оне сваке године исисавају новац из библиотечких буџета који би могао да буде употребљен за друге, продуктивније сврхе.

Са друге стране, Гугл нам је дао Гугл академца (Google Scholar), Гугл књиге, новинске архиве, и још много тога — пројекте који често надмашују комерцијалне понуде, а да су притом доступни сваком. Ако сагледамо ширу слику и не подлегнемо кратковидој опсесији највећом технолошком компанијом данашњице (да ли се сећате сличних жестоких напада на ИБМ, Мајкрософт?), схватићемо да је Гугл веома добар за историју и историчаре. Остаје нам само да се надамо да ће Гугл наставити да врши притисак на оне који нуде скупе алтернативе.

Наравно, као многи други који осећају посебну повезаност са књигама и нашим културним наслеђем, волео бих да пројекат Гугл књиге није под контролом приватног ентитета. Годинама сам указивао на потребу државног пројекта, или бар универзитетског конзорцијума, за скенирање књига у размерама у којима то Гугл покушава. Завидан сам због недавне најаве Француске да ће потрошити милијарду долара на јавно скенирање. Уз то, Центар за историју и нове медије има чврсте везе са Интернет архивом с којим се заједно залажемо за објављивање садржаја у непрофитабилном окружењу тако да се тај садржај може до максимума искористити и заиста учинити слободним и бесплатним.

Више бих волео када бих могао видим Гуглове књиге у Интернет архиву или Конгресној библиотеци. Постоји извесна нада да ће Hathi Trust бити тај нови шампион који није Гугл, али они се још увек ослањају углавном на Гуглове скенове. Вероватност да ће пројекат скенирања финансирати држава у доба када реакционарци у САД-у организују своје „чајанке” је веома мала.

* * *

Они који дуже време читају мој блог знају да сам увек био потпуно искрен када је реч о Гуглу. До сада највећи пораст броја читалаца мог блога десио се када сам, на самом почетку Гугловог пројекта скенирања књига, лежерно објавио ЛИНК скенирану слику људске шаке на коју сам наишао док сам прегледао једно издање Платона. Објава је завршила на сајту Digg, и од тада је Гуглови критичари користе као један од бројних примера за слаб квалитет Гугловог библиотечког пројекта.

Хајде да се на кратко позабавимо питањима квалитета, пошто је то једна од опсесија унутар академских кругова, опсесија која се мени чини помало непримерена. Наравно да Гугл има неке лоше скенове – као што изрека каже: што је брзо, то је и кусо – али још нисам видео научни преглед укупног процента страна које су нечитљиве или недостају (сигурно веома мали део судећи по резултатима које сам видео када је реч о викторијанским књигама). Што се тиче грешака у метаподацима, као што је приметио Џон Орвант из Гугл књига, када радите са билион комада метаподатака, вероватно је да ћете имати милионе грешака које треба исправити. Такође, хајде да се не претварамо да је библиографски свет изван Гугла савршен. Многи од проблема са метаподацима потичу од библиотечких партнера и других изван Гугла.

Поврх тога, Гугл вероватно има лека за многе од ових недостатака. Гугл константно побољшава своје оптичко препознавање знакова и способности за исправку метаподатака, и то чини на паметан начин. На пример, недавно је од Карнеги Мелон универзитета добио систем reCAPTCHA преко кога људи који се пријављују на онлајн сервисе транскрибују посебно тешке или умрљане речи из старих књига. Они су додали и механизам за фидбек како би корисници пријавили лоше скенове. Стварно лоше књиге се могу поново скенирати или заменити верзијама из других библиотека. Збуњују ме притужбе на квалитет Гугл књига које имају технолошка решења. То је управо оно што Гугл ради — решава технолошке проблеме веома добро.

Заиста, треба схватити (али не некритички, како ћемо видети касније) да су у својој суштини Гугл књиге, као толико ствари у Гуглу, резултат технолошког изазова и низа математичких проблема: Како можете скенирати десетине милиона књига за једну деценију? Лако је рећи да они треба да раде боље и све детаље ураде правилно, али ако направите прорачуне са оним кључним варијаблама, као што претпостављам да раде Брендон и његов тим, вероватно ћете схватити да би за готово савршен пројекат скенирања библиотеке било потребно сто а не десет година. (То би могао бити савршено добар компромис, али то је неки други аргумент или неки други пројекат.) Као и код оптичког препознавања знакова, постизање тачности од 99% до 99,9% би вероватно трајало ред величина дуже и било ред величина скупље. То је компромис који је Гугл решио да направи. Као компанија заинтересована за претраживање, где скоро стопостотна тачност није неопходна, и узимајући у обзир могућности усавршавања како се буду развијале даље верзије, мора да је то била лака одлука.

* * *

Пројекат Гугл књиге је невероватно користан, чак и са својим манама. Иако сам се школовао на местима са великим истраживачким библиотекама размера Гугл књига, сада сам у једној институцији која је много типичнија за високо образовање, са тек милион књига и мало ретких дела. На местима као што је универзитет Мејсон, Гугл књиге су спас јер омогућавају истраживање које се некада могло обавити само ако бисте доспели на права места. Редовно ми се дешава да студенти претраживањем Гугл књига открију нове теме које ће проучавати и о којима ће писати. Можете само да замислите како се историчари и сви студенти и истраживачи осећају на још мање привилегованим местима. Упркос својим недостацима, Гугл књиге ће бити извор за много радова из историјске науке широм света током наредних деценија. Гугл у великој мери омогућава једнакост приступа историјским изворима.

Гугл је такође добар за историју зато што доводи у питање вековне претпоставке о начину на који се бавимо историјом. Пре освита великих пројеката дигитализације и њихових подједнако важних индекса, нужно смо морали да правимо избор из гомиле аналогних докумената. Цео тај наш процес истраживања и одабирања, и ти одређени документи и докази о којима смо на крају доносили одлуку да пишемо, били су – признајмо то – подложни многим грешкама. Прочитајте све, говорили су нам на постдипломским студијама. Али, ко то икада чини? Пребирамо по великим архивама на основу интуиције; с времена на време чак пронађемо важне доказе пуком срећом. Понекад правимо од муве медведа јер, заправо, само имамо времена да се бавимо мувом, а не медведом. Без обзира на нашу технику, увек нешто изоставимо; у аналогном свету смо ретко свеобухватни.

Овај широко распрострањени проблем анегдотске историје, како је ја називам, ће само постајати све тежи. Како се све више докумената скенира и поставља на интернет, многа дела историчара ће бити огољена као климава и насумична. Модерна технологија претраживања би требало да нас погура да побољшамо историјска истраживања. Требало би да нам укаже на то да наше аналогне, нужно необјективне методе крију од нас потенцијал једног свеобухватнијег гледишта, потпомогнутог мање каприциозним механизмима за извлачење информација који су, упркос ономе што би могли да кажу њихови противници, често објективнији од брзог прелиставања листова папира када у временској стисци скокнемо до архива.

Уз то, ако га будемо слушали, Гугл би нам могао отворити нове путеве истраживања прошлости. У својој књизи Једначине од Бога (Equations from God) тврдио сам да је 1800. године математика сматрана божанским језиком, али је „секуларизована“ у деветнаестом веку. Део мог доказа је био да су математичке расправе, које су често садржале религијски језик у раном деветнаестом веку, изгубиле такав језик до краја века. Нужно, како сам истраживање вршио у ери пре Гугл књига, моји текстуални докази су били ограничени – могао сам да прочитам само одређени број расправа и одлучио да се усредсредим (сигуран сам да ће ово звучати познато) на дела истакнутих математичара. Ширина Гугл књига по први пут пружа прилику за свеобухватније прегледавање писања викторијанских математичара ради проналажења доказа о религијском језику. Ово важи за многе истраживачке пројекте историчара.

Тако нам Гугл поклања не само дарове бесплатног истраживања, већ и директни изазов за наше истраживачке методе, на чему треба да будемо захвални. Да ли је Гугл добар за историју? Наравно да јесте.

* * *

Али, да ли то значи да не можемо оставити могућност за конструктивну критику Гугла, да би га учинили најбољим што може да буде, посебно за историчаре? Наравно да не. Желео бих да се усредсредим на једно озбиљно питање које се провлачи кроз многе делове Гугл књига.

За компанију која је шампион у отворености, Гугл остаје необично затворен када је реч о Гугл књигама. Изгледа да Гугл књиге функционишу на начин који се разликује од других пројеката који су у власништву Гугла. На пример, не могу да разумем зашто Гугл не олакша историчарима као што сам ја, који желе да се баве техничким анализама историјских књига, да их много лакше преузму све одједном. Да хоће, Гугл би сутра могао да направи портал за преузимање свих књига из јавног домена. Чуо сам изговоре од људи из Гугла: али потрошили смо милионе на дигитализацију ових књига! Нећемо их тек тако дати! Па, Гугл је такође потрошио милионе на софтверске пројекте као што су Android, Wave, оперативни систем Chrome и претраживач Chrome, а њих нам дају без ограничења. Гуглово оклевање у погледу дигитализованих књига показује да отвореност у Гуглу иде само до извесне границе. Претпостављам да то треба да разумемо; Гугл је компанија, а не јавна библиотека. Али ту нема оне филантропске ауре којом је Гугл обавио свој библиотечки пројекат на самом почетку, па чак и данас, у драматичним коментарима који на сва звона разглашавају друштвену корист од Гугл књига.

Укратко, притужбе на квалитет Гуглових скенова одвлаче нашу пажњу од много већег проблема са Гугл књигама. Стварни проблем – посебно за оне који се баве дигиталним хуманистичким наукама, али све више и за многе друге – представља то што су Гугл књиге отворене само у смислу да могу да се читају у пиџами. Наравно, PDF-ови многих књига из јавног домена могу да се скину. Али, Гугл отежава преузимање оптички препознатих текстова из више књига из јавног домена одједном – а то је управо оно што би нам било потребно за софистициранија историјска истраживања. Али када кренемо изван јавног домена, Гугл се залаже за проблематичан, рестриктиван режим за милионе такозваних „књига сирочића”.

Волео бих да видим споразум који нуди већи, а не мањи приступ тим делима, уз већу расположивост онога што Клиф Линч зове „рачунарски приступ“ Гугл књигама, а то је виши ниво приступа код којег се не ради толико о читању једне странице на вашем компјутеру колико о примени дигиталних алата на много страна или књига одједном што би довело до стицања новог знања или разумевање. Ово је делимично обећано у споразуму о Гугл књигама у форми истраживачких центара за рударење текста, али ти центри ће бити резервисани за посебну клијентелу и сумњам да је вероватно да ће их обични историчари икад користити. Гугл има детаљно разрађене АПИ-је, или програмске интерфејсе за апликације, за већину својих сервиса, али само најповршнији приступ Гугл књигама.

За компанију која цвета захваљујући отворености и снази коју јој дају корисници и они који раде на развоју софтвера, Гугл књиге су прилично чудна појава. Уз много помпе, Гугл је недавно покренуо – очигледно због унутрашњих превирања – оно што назива „Фронт за ослобађање података“ (Data Liberation Front), како би обезбедио преносивост података и отвореност на целом Гуглу. На сајту фронта, dataliberation.org, Гугловци наводе списак 25 Гуглових пројеката и како да се максимизује преносивост и отвореност готово свих главних сервиса на Гуглу. Нажалост, нигде нема Гугл књига, иако оне такође обухватају податке креиране од стране корисника, као што је функција Моја библиотека, а да не помињемо све оне податке – то јест књиге – које смо сви платили својим пореским доларима и школарином. И док Че Геваре подижу своју револуционарну песницу са једне стране Гуглплекса, њихове колеге са друге стране раде са ограниченом групом аутора и издавача на стављању нејасних ограничења на велики део нашег културног наслеђа кроз споразум који подржава мало људи у академском свету.

Џон Орвант и Ден Кленси и Брендон Беџер су одлично објаснили већи део унутрашњег процеса Гугл књига. Али он још увек изгледа некако далек и стран на начин на који остали Гуглови подухвати то нису. То је делимично зато што су они окружени са свих страна адвокатима, па стога нису у могућности да одговарају на нека питања која имају људи из академског света, нити да установе либералнију политику и функције. Она иста смелост која је навела компанију да дигитализује читаве библиотеке такође ју је нагнала да оде предалеко са књигама које подлежу ауторским правима, доводећи до сукоба са ауторима и издавачима и до мањкавог споразума који данас имамо пред собом.

Треба да запамтимо да је разлог што сада имамо нагодбу у томе што Гугл није имао довољно смелости да изабере бољи и тежи пут – да директно преко судова, у јавности, или при Америчком конгресу, доведе у питање режим интелектуалне својине који управља многим књигама и отежава њихово постављање на интернет, иако њихових аутора или издавача одавно нема. Док Гугл редовно користи своју моћ да радикално мења тржишта, нетипично је благ у директним нападима на овај бастион интелектуалне својине и његове моћне корпоративне браниоце. Да је Гугл заузео чвршћи став, историчари би вероватно у потпуности подржали његове напоре, јер се и ми суочавамо са проблемима којима неизбалансирани закон о ауторским правима оптерећује нашу употребу текстуалних, визуелних, аудио и видео доказа у научне и педагошке сврхе.

Много бих више волео да историчари и Гугл раде заједно. Док Гугл као истраживачка алатка доводи у питање наше традиционалне научне методе, историчари би могли да преиспитају и учине бољим оно што ради Гугл. Историјска и хуманистичка питања представљају неке од најкомплекснијих технолошких изазова са којима се Гугл суочава, слично или можда још више него што то чини машинско превођење, тако да би Гуглови инжењери могли много да науче из наше научне праксе. Гуглови алгоритми су током последње деценије оптимизовани за претраживање хиперлинкованих докумената на вебу. Али ти исти алгоритми се спотичу када се суоче са чудним изазовима промене кроз векове и са страношћу прошлости и старих књига и докумената које историчари свакодневно испитују.

Пошто су Гугл књиге производ инжењера са огромним талентом за информатику, али са мање смисла за историју књиге и књигу као објекат, а не скуп битова, овај пројекат доживљава неуспех на неколико нивоа. Гугл још увек нема довољно осећаја како да рангира резултате претраге по хуманистичким корпусима. Библиометрија и рударење текста дају слабе резултате на овим изворима (насупрот, рецимо, високо структурисаним научним документима за које је специјализован Гугл академац). Проучавањем начина на који историчари сврставају и сортирају примарне и секундарне изворе Гугл би могао да сазна много тога што би онда могао да искористи како би помогао научницима.

Коначно, интересантно питање можда није да ли је Гугл добар за историју, већ да ли је историја добра за Гугл? На оба питања, мој одговор је: да.

Са енглеског превела: Ирена Марински