Ja wciąż nie słyszałem...

Pod koniec poprzedniego wpisu cisnęło mi się pod palce oczywiste w tym kontekście pytanie: jeżeli tak łatwo jest używać osadzonego RDF-a w XHTML, tak łatwo go stamtąd wydobyć, i tak łatwo jest tworzyć strony odczytywalne równocześnie dla człowieka i maszyny (agenta SW, czy jak go tam nazwiemy)[1], to dlaczego tak mało jest tego typu rozwiązań w prawdziwej (w sensie: nie akademickiej) sieci WWW?

Odpowiedź z jednej strony jest banalnie oczywista — to się jeszcze dzisiaj nie sprzeda, więc nie ma zainteresowania ze strony marketingowców ani dziennikarzy. A niestety jest tak, że bez zainteresowania tych dwóch grup darmozjadów niewiele się da w branży IT osiągnąć... Proste. Niestety zainteresowanie to wymaga wymyślenia jakiejś kretyńskiej, acz chwytliwej nazwy, np. „Web 3.0”, bo bez dobrej nazwy ani rusz. Na to z kolei jest trochę za wcześnie — dojna krowa „Web 2.0” jest jeszcze całkiem wydajna. Czyli ... postponed.

Ponieważ jednak zadowalanie się takimi prostymi odpowiedziami „to moja część, której nie lubię lubić”, puściłem mimo uszu tę pierwszą (chociaż pewnie słuszną) myśl i wsłuchałem się w Myśl Drugą. A jest ona niestety zdecydowanie niepochlebna dla ogółu tzw. łebdeweloperów. Ale po kolei...

naprzód marsz(?)

Sieć Semantyczna jest przejawem ewolucji sieci WWW. A chyba trudno o ewolucyjne przejście z jednego stanu do drugiego, skoro ten pierwszy właściwie nie nastąpił. Jakiś biolog może mnie tu poprawić — bardzo proszę. Jednak nawet na „chłopski rozum” wydaje się całkiem jasne, że aby przejść do faktycznie funkcjonującej postaci Sieci Semantycznej musimy „zaliczyć” najpierw etap WWW. Co więcej, nie byle jakiego WWW — Semantic Web nie ma sensu i szans istnienia bez dobrze udokumentowanych i przestrzeganych standardów. Metodą „wiecie, rozumiecie” to się mogą dogadać ludzie (a i to nie wszyscy); maszyny nie dadzą rady. A w Sieci Semantycznej przecież głównie o maszyny chodzi.

Niestety z tymi standardami to bywa ciągle słabo...

Molly z ludem doświadczenia

Aby nie być tak całkiem gołosłownym chociaż raz, powołam się na jakiś rozpoznawalny autorytet. Jak na życzenie Molly miała niedawno taki post:

As some folks know, I’ve been touring Europe and presenting on Web browsers, Web standards, and CSS. Here are some of the general and sobering situations I’m running across the deeper I go into under-represented countries when it comes to educational opportunities and resources.

Let’s start with a visit to Hungary. The conference attendees in Budapest were made up of people from all over Eastern and Central Europe. Of approximately 200 attendees:

  • 90% have been working with HTML (or XHTML) for five years or longer
  • 15% have been working with CSS for three years or longer
  • 75% are still using tables for layout
  • 2% knew what the DOCTYPE switch was
  • No one expressed interest or concern in accessibility for the Web
  • About 4-5 people were on par with advanced developers in the UK, US or Australia

Next, Amsterdam. Mostly Dutch attendees. Typically perceived as a more technically advanced country, of the some 200 folks I interacted with over 2 days:

  • 90% have been working with HTML (or XHTML) for five years or longer
  • 45% have been working with CSS for three years or longer
  • 65% are using tables for layout
  • 10% knew what a DOCTYPE switch was
  • No one expressed interest or concern about accessibility for the Web
  • About 20 people were on par with advanced developers in the UK, US or Australia

Now, Zurich. Swiss and German attendees. Smaller group, 50 - 75 or so:

  • 90% have been working with HTML (or XHTML) for five years or longer
  • 10% work with CSS at all
  • 98% are using tables for layout
  • 2 people knew about the DOCTYPE switch
  • 1 person expressed a great interest in accessibility (he explained his mother has a disability and that’s why he got interested in the topic)
  • 1 person actually asked me “Is it really possible to use CSS to lay out sites?

Okay, this is just an anecdotal sampling, but it reflects what I’ve seen in Asia, too. We forget how elite we are, how privileged to even have the conversations that we do.

Wniosek niestety jest tyleż oczywisty co przykry. Niedorośli ście śmy nawet do aktualnych standardów WWW. Jaki w takim razie ma w ogóle sens gadanie o Sieci Semantycznej i mechanizmach w niej funkcjonujących...? Czy jest sens próbować wykonać następny krok, skoro tak ogromna większość ma kłopoty z wykonaniem kroku poprzedniego...? :-/

[1]Odczytywalne również z wykorzystaniem technologii adekwatnych do dzisiejszego WWW, jak PHP. Przecież omawiany GRDDL to tylko XSLT i potem to wrzucamy w coś takiego jak np. RAP. Gdzie tu jakiś problem?

Komentarze

#1 | 2007.07.09 22:55 | reuptake

pisałem kiedyś o tym na blogu: sieci semantycznej nie ma, bo jest ona "pchana" a nie "ciągniona". dużo jest pisania o tym, zachęcania, straszenia (kija), mało marchewki. jest jedna firma, które mogłaby bardzo szybko spowodować ruszenie się semantic web z marazmu, jest to google. niestety, google czuje się w sieci, gdzie "waga" dokumentu zależy nie od jego znaczenia, a od liczby linków do niego, jak ryba w wodzie. ale gdyby (pomarzyć) google chciało wyżej rankingować oznakowane semantycznie strony, to zaraz cały biznes SEO by odpowiedział masowym dodawaniem semantycznego markupu (oczywiście tu też byłyby nadużycia). dziennikarze / marketingowcy nie mają tu nic do rzeczy. oni zauważają wszystko po fakcie.

#2 | 2007.07.09 23:32 | MiMaS

Hmm.. jedno pytanie kontrolne, bo obawiam się, że mam mały kłopot ze zrozumieniem Twojej argumentacji — co konkretnie rozumiesz przez „semantyczny markup” i co to niby ma wspólnego z Semantic Web?

Osobiście nie widzę powodu żeby „google chciało wyżej rankingować” cokolwiek, skoro ta firma istnieje w znacznej mierze dzięki temu, że nie istnieje na szeroką skalę Sieć Semantyczna — dzisiejsze WWW wymaga żmudnego i iteracyjnego wyszukiwania informacji przez człowieka, a ten się łatwo rozprasza (reklamami np.) i jest podatny na sugestie (typu pozycja na liście wyników). Wpuścimy zamiast tego autonomicznych agentów i Google straci kawał rynku ot tak.

Niemniej nie stanowi to odpowiedzi na pytania w treści wpisu. Nie ważne co na to Google i czy w ogóle ma cokolwiek do gadania. Ważniejsze czy jesteśmy w stanie stworzyć coś nowego, skoro to, co mamy teraz, w tak wielu miejscach kuleje...?

#3 | 2007.07.10 15:57 | Marcin Jagodzinski

może wyrażam się nieściśle, semantyczny markup to i HTML pozbawiony elementów czysto prezentacyjnych, jak i metainformacje o dokumencie (lub jego fragmentach).

niestety, masz rację, że googlowi niestety nie zależy. a mógłby być tą siłą. bo wydaje mi się, że na tym etapie nie zmusimy się do stworzenia semantycznej sieci, jeśli nie będzie popytu. a popytu nie ma.

#4 | 2007.07.10 18:17 | Kamil Trebunia // ffreak

Ja się do końca nie zgadzam...

Postrzegam termin "Sieć Semantyczna" jako wór technologii, ideii, koncepcji. I z tego punktu widzenia...

Internet nie musi być w całości, ani nawet w dużych partiach semantyczny, żeby można było mówić o Sieci Semantycznej.

Przykład 1:
Żeby zacząć realizować wybrane koncepty można sobie potrzebne dane podrasować, usemantycznić, a dopiero wtedy przejechać się GRDDL-owym agentem. Zresztą i to nie zawsze jest opłacalne, bo jeśli źródeł danych, więc wystarczy napisać własny mechanizm GRDDL (bo jak wytłumaczył wyżej MiMaS to wg specyfikacji GRDLL standardowym mechanizmem jest arkusz XSLT 1.0), który będzie wyciągał RDF ze zwyczajnego HTML-a, nawet i bez kropli metadanych. Fakt, że to bardzo kulawe rozwiązanie, ale "the future belongs to those who take the present for granted".

Przykład 2:
API. No przecież wszędzie wokół wszyscy wszystko standaryzują. Przecież wszyscy ostatnio budują API i udostępniają ile się da, albo ile im się wydaje, że się im opłaca. Co z tego wynika? Że chcą te dane udostępniać i robią to najlepiej jak potrafią. Można by te dane udostępniać przy pomocy jakichś słowników, ontologii. I te ontologie również otworzyć, udostępnić. Zysk: ogromny. Ryzyko: no jakie?

Moim zdaniem odliczanie trwa i już za kilka miesięcy będziemy obserwować jaskółki, albo i całkiem spektakularne implementacje.

To nie będzie Sieć Semantyczna w rozumieniu Semantyczne Wszystko Co Się Da Z Internetem A W Tym Blogiem Mojej Córki Na Czele, ale to wciąż będzie realizacja tej właśnie koncepcji.

Nie myślcie o Sieci Semantycznej jako o koncepcji realizowalnej tylko pod warunkiem usemantycznienia wszystkiego. Po matematycznemu: jest to warunek wystarczający, ale nie nie jest to warunek konieczny.

#5 | 2007.07.10 18:38 | MiMaS

Internet nie musi być w całości, ani nawet w dużych partiach semantyczny, żeby można było mówić o Sieci Semantycznej.

Otóż to. A już na pewno dzisiejsze WWW nie musi być „semantyczne”. Zresztą myślę, że nastąpiło tutaj pomylenie pojęć „semantyczny markup” i Semantic Web — o tym mój następny wpis...

 

Uwaga: Ze względu na bardzo intensywną działalność spambotów komentowanie zostało wyłączone po 60 dniach od opublikowania wpisu. Jeżeli faktycznie chcesz jeszcze skomentować skorzystaj ze strony kontaktowej.