Svi smo mi kao djeca skupljali stvari poput sličica, autića i sl. Trenutno postoje poslovne organizacije širom svijeta sa nevjerojatnom zbirkom stvari a njihov broj se mjeri u trilijunima. U mnogim slučajevima ove zbirke odnosno baze podataka se sastoje od stavki koje koristimo svaki dan. U ovom popisu, pokrivamo top 5 najvećih baza podataka na svijetu:

Kongresna knjižnica (Library of Congress)

library-of-congressČak ni digitalno doba ne može spriječiti najveću svjetsku knjižnicu da bude na ovom popisu. Library of Congress, ima više od 130 milijuna predmeta od knjiga za kuhanje preko kolonijalnih novina pa sve do postupka vlade SAD-a. Procjenjuje se da bi tekstualni dio Kongresne knjižnice sadržavao 20 terabajta podataka. Kongresna knjižnica se dnevno širi za 10.000 predmeta, a ima blizu 853 kilometara polica.

Ako istražujete neku temu i ne možete naći prave informacije na internetu onda je pravo odredište za vas Kongresna knjižnica. Za istraživanje američke povijesti oko 5 milijuna stvari iz zbirke Kongresne knjižnice se može naći on-line na American Memory.

Evo nekih bitnih brojki Kongresne knjižnice:

  • 130 milijuna predmeta (knjige, fotografije, karte, itd.)
  • 29 milijuna knjiga
  • 10.000 novih stavki koje se dodaju svaki dan
  • 853 kilometra polica
  • 5 milijuna digitalnih dokumenata
  • 20 terabajta tekstualnih podataka

Central Intelligence Agency (CIA)

CIA1 Središnja obavještajna agencija (CIA) prikuplja i distribuira informacije o ljudima, mjestima i stvarima, tako da ne čudi što je na ovom popisu. Iako se malo zna o ukupnoj veličini CIA-ne baze podataka, sigurno je da agencija ima jako mnogo informacija i o javnom i privatnom sektoru putem terenskog rada i digitalnih upada.

Dijelovi baze CIA-e na raspolaganju su javnosti a obuhvaćaju Freedom of Information Act (FOIA) Elektronsku čitaonicu, World Fact Book i razne druge publikacije povezane sa agencijom. FOIA knjižnica uključuje stotine tisuća službenih (a povremeno i ultra-osjetljivih) dokumenata američke vlade koji su na raspolaganju javnosti u elektronskom obliku. Knjižnica se mjesečno uvećava sa po 100 članaka i sadrži teme od nuklearnog razvoja u Pakistanu do vrsti piva koje su bile na raspolaganju tijekom korejskog rata. World Fact Book ima opće informacije o svakoj državi i teritoriji u svijetu uključujući mape, broj stanovnika, vojnu sposobnost i ostalo.

U brojkama to izgleda ovako:

  • 100 FOIA predmeta dodaje se svaki mjesec
  • Opsežna statistika o više od 250 zemalja i entiteta
  • Nepoznati broj tajnih podataka

Amazon

amazon_logo Amazon je najveća svjetska trgovina koja sadrži opsežnu evidenciju o 59 milijuna svojih aktivnih klijenata, uključujući opće osobne podatke (broj telefona adresu, itd), popis želja i gotovo bilo koju vrstu podataka koju web stranice mogu izvući od svojih korisnika. Amazon čuva više od 250.000 cijelih tekstualnih knjiga koje su na raspolaganju online i omogućuje korisnicima da komentiraju i imaju interakciju na gotovo svakoj web stranici što ćini Amazon jednom od najvećih svjetskih on-line zajednica.

Ovi podaci zajedno sa milijunima stavki inventara koji Amazon prodaje svake godine i milijune stavki u inventaru koje preko Amazona prodaju drugi, čini jednu vrlo veliku bazu podataka. Amazon-ove dvije najveće baze podataka zajedno imaju više od 42 terabajta podataka.

Ali ako mislite da i 42 terabajta podataka nisu nešto previše, u relativnom smislu, 42 terabajta podataka bi bilo jednako 37 trilijuna forum postova.

Amazon brojke:

  • 59 milijuna aktivnih korisnika
  • Više od 42 terabajta podataka

YouTube
YouTube Nakon manje od dvije godine rada YouTube je sakupio najveću videoteku (a nakon toga i jednu od najvećih baza podataka) u svijetu. YouTube trenutno ima bazu korisnika kojoj nudi više od 100 milijuna isječaka dnevno što je više od 60% svih videa koji se gledaju na Internetu.

U kolovozu 2006, Wall Street Journal je projicirao YouTube-ovu bazu podataka na 45 terabajta videa. YouTube u zadnje vrijeme doživljava znatan rast (više od 65.000 novih videa danevno), što znači da se YouTube-ova veličine baze podataka više nego udvostručila u posljednjih 5 mjeseci.

Procjena veličine YouTube-ove baze podataka je posebno teška s obzirom na različite veličine i dužine svakog videa. Međutim, ako bi se bavili procjenama, očekivati je da YouTube-ova baza podataka naraste za čak 20 terabajta podataka sljedećeg mjeseca.

Ako računamo: 65.000 videa dnevno X 30 dana mjesečno = 1.950.000 videa mjesečno, 1 terabajt = 1.048.576 megabajta. Ako pretpostavimo da svaki video ima veličinu od 1MB, YouTube treba da očekuje rasti od 1,86 terabajta sljedećeg mjeseca. Slično tome, ako pretpostavimo da svaki video ima veličinu od 10 MB, onda je za očekivati da će rasti biti18,6 terabajta sljedećeg mjeseca.

YouTube brojke:

  • 100 milijuna videa koji se gledaju dnevno
  • 65.000 videa dodanih svaki dan
  • 60% svih videa koji se gledaju online
  • Najmanje 45 terabajta videa

ChoicePoint

ChoicePoint Zamislite da morate da pretražite imenik koji sadrži milijarde stranica radi jednog telefonskog broja. Kada zaposleni u ChoicePoint-u žele znati nešto o vama oni moraju učiniti upravo to. Ako bi se ispisala, ChoicePoint-ova baza podataka bi išla do Mjeseca i natrag čak 77 puta.

ChoicePoint je u poslu vezanom za dobivanja informacija o američkoj populaciji, adresama i telefonskim brojevima, evidenciji vožnje, kaznene povijesti, itd., ChoicePoint ima sve.

U 2002 godini ChoicePoint je bio u mogućnosti da pomogne vlastima da riješi slučaj serijskog silovatelja u Philadelphiji i Fort Collins na osnovu popisa 6 potencija
lnih osumnjičenika njihov DNK i osobnih zapisa baze podataka. U 2001 godini ChoicePoint je bio u mogućnosti da identifikuje ostatke žrtava World Trade Center usklađivanjem DNK pronađenih u fragmentima kosti sa informacijama žrtvnih članova obitelji u svezi sa podacima nalaza u njihovim bazama podataka.

ChoicePoint brojke:

  • 250 terabajta osobnih podataka
  • Podaci o 250 milijuna ljudi