Universal'nyj lokator resursov


Shemy adresacii resursov
HTTP FTP Goper Mailto News NNTP WAIS File Telnet

Iz vseh specifikacij World Wide Web tol'ko specifikaciya URI dovedena do sostoyaniya URI opredelyaet sposob zapisi (kodirovaniya) adresov razlichnyh informacionnyh resursov pri obrashchenii k nim iz stranic WWW. Odnako v poslednee vremya dannaya specifikaciya stala vstrechat'sya i v pochtovyh soobshcheniyah. Pri etom, vidimo predpolagaetsya, chto pol'zovateli pochty dolzhny ispol'zovat' klientov podderzhivayushchih etot format soobshcheniya. Real'no rech' mozhet idti o klientah MIME (Multiperposal Internet Mail Exchange).

Neobhodimost' v URI byla ponyatna razrabotchikam WWW c momenta zarozhdeniya sistemy, t.k. predpolagalos' ob®edinenie v edinuyu informacionnuyu sredu sredstv, ispol'zuyushchih razlichnye sposoby identifikacii informacionnyh resursov. Pervonachal'no eto byli FTP arhivy, informacionno-poiskovaya sistema Alise i spravochnaya sistema CERN. Odnako Berners Li podoshel k delu osnovatel'no i razrabotal specifikaciyu, kotoraya vklyuchala v sebya obrashcheniya k FTP, Gopher, WAIS, Usenet, E-mail, Prospero, Telnet, Whois, X500 i konechno HTTP(WWW). V itoge byla razrabotana universal'naya specifikaciya, kotoraya pozvolyaet rasshiryat' spisok adresuemyh resursov za schet poyavleniya novyh.

Mesto primeneniya URI -- gipertestovye ssylki, kotorye zapisyvayutsya v tagah < A HREF=URI > i < LINK HREF=URI >. Vstraivaemye graficheskie ob®ekty takzhe adresuyutsya po specifikacii URI v tagah < IMG SRC=URI > i <FIG SRC=URI >. Realizaciya URI dlya WWW nazyvaetsya URL(Uniform Resource Locator). Tochnee, URL -- eto realizaciya shemy URI, otobrazhennaya na algoritm dostupa k resursam po setevym protokolam. Sushchestvuet eshche i URN (Uniform Resource Name), kotoroe otobrazhaet URI v prostranstvo imen na seti. Voobshche govorya, na moj vzglyad eto uzhe perebor. Sobstvenno, poyavlenie URN svyazano s zhelaniem adresovat' chasti pochtovogo soobshcheniya MIME. No zdes' est' moment, kotoryj nahoditsya v stadii debatov. Soobshchenie "zhivet" ne bolee 5 dnej. Esli ono sohraneno, to ego mozhno prevratit' v drugoj informacionnyj resurs, naprimer WWW stranicu. Poetomu sud'ba URN eshche ne reshena.

Pri razrabotke URI presledovalis' sleduyushchie principy:

  • Rasshiryaemost' -- novye adresnye shemy dolzhny byli legko vpisyvat'sya v sushchestvuyushchij sintaksis URI.
  • Polnota -- po vozmozhnosti, lyubaya iz sushchestvovavshih shem dolzhna byla opisyvat'sya posredstvom URI.
  • CHitaemost' -- adres dolzhen byl byt' legko chitaem chelovekom, chto voobshche harakterno dlya tehnologii WWW -- dokumenty vmeste s ssylkami mogut razrabatyvat'sya v obychnom tekstovom redaktore. Polnota i CHitaemost' porozhdali kolliziyu, svyazannuyu s tem, chto v nekotoryh shemah ispol'zuetsya dvoichnaya informaciya. |ta problema byla reshena za schet formy predstavleniya takoj informacii. Simvoly, kotorye nesut sluzhebnye funkcii i dvoichnye dannye otobrazhayutsya v URI v shestnadcaterichnom kode i predvaryayutsya simvolom "%".

    Prezhde, chem rassmotret' razlichnye shemy predstavleniya adresov, privedem primer prostogo adresa URI:
    http://polyn.net.kiae.su/polyn/index.html

    Pered dvoetochiem stoit imya shemy adresa -- "http". |to imya otdeleno dvoetochiem ot ostatka URI, kotoryj nazyvaetsya put'. V dannom sluchae put' sostoit iz domennogo adresa mashiny, na kotoroj ustanovlen server HTTP i puti ot kornya dereva servera k fajlu "index.html".

    Krome predstavlennoj vyshe polnoj zapisi URI, sushchestvuet uproshchennaya. Ona predpolagaet, chto k momentu ee ispol'zovaniya mnogie parametry adresa resursa uzhe opredeleny (protokol, adres mashiny v seti, nekotorye elementy puti). Pri takih predpolozheniyah avtor gipertekstovyh stranic mozhet ukazyvat' tol'ko otnositel'nyj adres resursa, t.e. adres otnositel'nyj bazovyh opredelennyh resursov.

    V RFC 1630 rassmotreno 8 shem adresacii resursov internet i ukazany dve, chej sintaksis nahoditsya v stadii obsuzhdeniya.

    Shema HTTP. |to osnovnaya shema dlya WWW. V sheme ukazyvaetsya ee identifikator, adres mashiny, TCP port, put' v direktorii servera, poiskovyj kriterij i metka. Privedem neskol'ko primerov URI dlya shemy HTTP.
    http://polyn.net.kiae.su/polyn/manifest.html

    |to naibolee rasprostranennyj vid URI, primenyaemyj v dokumentah WWW. Vsled za imenem shemy (http) sleduet put', sostoyashchij iz domennogo adresa mashiny i polnogo adresa HTML dokumenta v dereve servera HTTP.

    V kachestve adresa mashiny dopustimo ispol'zovanie i IP adresa:
    http://144.206.160.40/risk/risk.html
    Esli server protokola HTTP zapushchen na drugoj, otlichnyj ot 80 port TCP, to eto otrazhaetsya v adrese:
    http://144.206.130.137:8080/altai/index.html
    Pri ukazanii adresa resursa vozmozhna ssylka na tochku vnutri fajla HTML. Dlya etogo vsled za imenem dokumenta mozhet byt' ukazana metka vnutri dokumenta:
    http://polyn.net.kiae.su/altai/volume4.html#first
    Simvol "#" razdelyaet imya dokumenta ot imeni metki. Drugaya vozmozhnost' shemy HTTP -- peredacha parametrov. Pervonachal'no predpolagalos', chto v kachestve parametrov budut peredavat'sya klyuchevye slova, no, pomere razvitiya mehanizma SGI skriptov, v kachestve parametrov stala peredavat'sya i drugaya informaciya.
    http://polyn.net.kiae.su/isindex.html?keyword1+keyword2
    V dannom primere predpolagaetsya, chto dokument "isindex.html" - dokument s vozmozhnost'yu poiska po klyuchevym slovam. Pri etom v zavisimosti ot poiskovoj mashiny (programmy, realizuyushchej poisk) znak "+" budet interpritirovat'sya libo kak "AND", libo kak "OR". Voobshche govorya, "+" - zamenyaet " " i otnositsya k klassu neotobrazhaemyh simvolov. Esli neobhodimo peredat' takoj simvol v stroke parametrov, to sleduet peredavat' v shestnadcatirichnom vide ego ASCII kod.
    http://polyn.net.kiae.su/isindex.html?keyword1%20keyword2
    V dannom sluchae imetsya odin parametr v kotorom dva slova razdeleny probelom. Simvol "%" oboznachaet nachalo ASCII koda, kotoryj prodolzhaetsya do pervogo simvola otlichnogo ot cifry.

    Pri ispol'zovanii HTML Forms parametry peredayutsya kak poimenovannye polya:
    http://polyn.net.kiae.su/isindex.html?field1=value1+field2=value2
    Znacheniya "field1" i "field2" - eto imena polej, a "value1" i "value2" - ih znacheniya. Pri etom privedennomu vyshe URI mozhet sootvetstvovat' sleduyushchaya HTML forma:
    < FORM ACTION=http://polyn.net.kiae.su/cgi-bin/test >
    Vvedite zanacheniya polej:
    Pole "field1":< INPUT NAME="filed1" VALUE="value1" >
    Pole "field2":< INPUT NAME="field2" VALUE="value2" >
    < HR >
    < /FORM >

    Shema FTP. Dannaya shema pozvolyaet adresovat' fajlovye arhivy FTP iz programm-klientov World Wide Web. Pri etom programma dolzhna podderzhivat' protokol FTP. V dannoj sheme vozmozhno ukazanie ne tol'ko imeni shemy, adresa FTP arhiva, no i identifikatora pol'zovatelya i dazhe ego parolya. Naibolee chasto dannaya shema ispol'zuetsya dlya dostupa k publichnym arhivam FTP:
    ftp://polyn.net.kiae.su/pub/0index.txt
    V dannom sluchae zapisana ssylka na arhiv "polyn.net.kiae.su" c identifikatorom "anonymous" ili "ftp" (anonimnyj dostup). Esli est' neobhodimost' ukazat' identifikator pol'zovatelya i ego parol', to mozhno eto sdelat' pered adresom mashiny:
    ftp://nobody:password@polyn.net.kiae.su/users/local/pub
    V dannom sluchae eti parametry otdeleny ot adresa mashiny simvolom "@", i otdeleny drug ot druga dvoetochiem. V nekotoryh sistemah mozhno ukazat' i tip peredavaemoj informacii, no dannaya vozmozhnost' ne standartizirovana. Standart rekomenduet opredelyat' tip po harakteru dannyh (tekstovaya informaciya- ASCII, dvoichnaya - IMAGE). Sleduet takzhe uchityvat', chto upotreblenie identifikatora pol'zovatelya i ego parolya ne rekomendovanno, t.k. dannye peredayutsya nezashifrovannymi i mogut byt' perehvacheny. Real'naya zashchita v WWW osushchestvlyaetsya drugimi sredstvami i postroena na drugih principah.

    Shema Gopher. Dannaya shema ispol'zuetsya dlya ssylki na risursy raspredelennoj informacionnoj sistemy Gopher. Shema sostoit iz identifikatora i puti, v kotorom ukazyvaetsya adres Gopher servera, tip resursa i komanda Gopher.
    gopher://gopher.kiae.su:70:/7/kuku
    V dannom primere osushchestvlyaetsya dostup k gopher serveru gopher.kiae.su cherz port 70 dlya poiska (tip 7) slova "kuku". Sleduet zametit', chto gopher tip, v dannom sluchae 7, peredaetsya ne pered komandoj, a vsled za nej.

    Shema MAILTO. Dannaya shema prednaznachena dlya otpravki pochty po standartu RFC822(standart pochtovogo soobshcheniya). Obshchij vid shemy vyglyadit kak:
    mailto:paul@quest.polyn.kiae.su

    Shema NEWS. Dannaya shema ispol'zuetsya dlya prosmotra soobshchenij sistemy Usenet. Pri ispol'zovanii etoj shemy ispol'zuetsya sleduyushchaya notaciya:
    news:comp.infosystems.gopher
    V dannom sluchae mozhno poluchit' stat'i i gruppy "comp.infosystems.gopher" v rezhime uvedomleniya. Mozhno poluchit' i tekst stat'i, no v etom sluchae ukazyvayut ee identifikator:
    news:086@comp.infosystems.gopher
    Zakazana 86 stat'ya iz gruppy.

    Shema NNTP. |to eshche odna shema polucheniya dostupa k resursam Usenet. V dannoj sheme obrashchenie k gruppe comp.infosystems.gopher dlya polucheniya 86 stat'i budet vyglyadet' tak:
    nntp:comp.infosystems.gopher/086
    sleduet obratit' vnimanie na to, chto adres servera Usenet ne ukazan. Programma-klient dolzhna byt' predvaritel'no skonfigurirovana na rabotu s odnim iz serverov Usenet. Sama sluzhba Usenet yavlyaetsya raspredelennym informacionnym resursom i gruppa comp.infosystems.gopher na servere v domene kiae.su ili gde-libo eshche v mire soderzhit odni i te zhe soobshcheniya.

    Shema TELNET. Dostup k resursu v rezhime udalennogo terminala osushchestvlyaetsya po eto sheme. Obychno, klient vyzyvaet dopolnitel'nuyu programmu dlya raboty po protokolu telnet. Pri ispol'zovanii etoj shemy neobhodimo ukazyvat' identifikator pol'zovatelya, i vozmozhno ispol'zovanie parolya. Real'no, dostup osushchestvlyaetsya k publichnym resursam i identifikator i parol' yavlyayutsya obshcheizvestnymi, naprimer ih mozhno uznat' v bazah dannyh Hytelnet.
    telnet://guest:password@apollo.polyn.kiae.su

    Shema WAIS. WAIS -- raspredelennaya informacionno-poiskovaya sistema. Uchityvaya, chto ona rabotaet v dvuh rezhimah: poiska i prosmotra. Pri poiske ispol'zuetsya forma so znakom "?", otdelyayushchim adresnuyu chast' v puti ot klyuchevyh slov:
    wais://wais.think.com/wais?guide
    V dannom sluchae obrashchayutsya k baze dannyh wais na servere wais.think.com s zaprosom na poisk dokumentov so slovom guide. Server dolzhem vernut' klientu spisok dokumentov. Posle polucheniya etogo spiska mozhno ispol'zovat' vtoruyu formu shemy wais -- zapros na prosmotr dokumenta:
    wais://wais.think.com/wais/wtype/039=/kuku/kuku.txt
    039 -- eto identifikator dokumenta. Sleduet zametit', chto ne vse klienty umeyut rabotat' s etoj shemoj, i vryade sluchaev sleduet pol'zovat'sya drugimi sredstvami. Shema wais horosha tam, gde nado obsluzhivat' postoyanno dejstvuyushchij zapros, kotoryj neizmenen na protyazhenii dlitel'nogo vremeni, no pri etom vydaet svezhie dokumenty.

    Shema FILE. World Wide Web tehnologiya ispol'zuetsya kak v setevom, tak i v lokal'nom rezhimah. Dlya lokal'nogo rezhima ispol'zuyut shemu FILE.
    file:///C|/text/html/index.htm
    V dannom primere privedeno obrashchenie k lokal'nomu dokumentu na personal'nom komp'yutere s MS-DOS ili MS-Windows. Sleduet zametit', chto dannaya shema ne mozhet byt' primenena k CGI skriptam. Ochen' chasto, odnako, pol'zovateli pytayutsya primenit' file k skriptu, chto yavlyaetsya oshibkoj. Lyuboj skript mozhet byt' zapushchen tol'ko serverom HTTP, t.k. emu nado peredavat' parametry i dannye. Klient zapuskaet tol'ko programmy prosmotra na osnove MIME tipov iz zagolovka soobshchenij servera ili po rasshireniyu fajla.

    Sushchestvuet eshche neskol'ko shem. |ti shemy real'no prakticheski ne ispol'zuyutsya ili nahodyatsya v stadii razrabotki, poetomu ostanavlivat'sya na nih my ne budem.

    Iz privedennyh vyshe primerov vidno, chto specifikaciya adresov resursov URI yavlyaetsya dovol'no obshchej i pozvolyaet proidentificirovat' prakticheski lyuboj resurs Internet. Pri etom chislo resursov mozhet rasshiryat'sya za schet sozdaniya novyh shem. Oni mogut byt' pohozhimi na sushchestvuyushchie, a mogut i otlichat'sya ot nih. Real'nyj mehanizm interpretacii identifikatora resursa, opirayushchijsya na URI, nazyvaetsya URL i pol'zovateli WWW imeyut delo imenno s nim.