archiwum tematu „semantic web” z roku 2006

(rd)ffreak — dialog

Poniżej i w kilku następnych wpisach przedstawiam przebieg jednej z bardziej interesujących dyskusji e-mailowych jakie mi się w ostatnim czasie zdarzyły. kt to Kamil Trebunia aka ffreak, ms to ja. Dialog nie autoryzowany, choć autentyczny i publikowany za obopólną zgodą.

Semantic Radar + Ping the Semantic Web.com

Przesadzony nagłówek prasowy tanio sprzedam: „Firefox nadal przoduje w dodatkach dla Sieci Semantycznej”. ;-) Tym razem znalazłem małe rozszerzenie zwane Semantic Radar for Firefox (albo też SIOC Detector).

Embedded RDF w blogu

O Embedded RDF pisałem już kiedyś. Użyłem nawet określenia „spory potencjał”. Po ponad pół roku zastanawiania się, może już czas zweryfikować to w praktyce... Od dziś publikowane tutaj treści potrafią przedstawić się jako RDF.

Ontologie dla laików aka poradnik sapera — odcinek #3

Kontynuując notatki na temat tworzenia ontologii OWL... Hierarchie klas i właściwości to zdecydowanie za mało by mógł powstać sensowny opis jakiejkolwiek nie trywialnej dziedziny pojęciowej. Siła języków definiowania ontologii jest możliwość definiowania pojęć na podstawie ich cech charakterystycznych lub ograniczeń jakie muszą spełniać. Dlatego OWL jest w tym zakresie bardzo mocno rozbudowany. A jak uczy doświadczenie, każdy rozbudowany mechanizm stwarza multum możliwości jego błędnego użycia.

What Is RDF. Ponownie

Klasyczny artykuł „What Is RDF” na XML.com doczekał się trzeciego wydania.

niekompetencja, kłamstwa, interesy

Wbrew pozorom nie będzie o politykach. ZDNet News uraczyło nas wczoraj artykułem o intrygującym tytule Google exec challenges Berners-Lee. Jest to krótki zapis interakcji w jaką wdali się Tim Berners-Lee („the father of the Web”) i Peter Norvig („Google Director of Search and AAAI Fellow”) podczas AAAI06.

Ontologie dla laików aka poradnik sapera — odcinek #2

Kontynuując wątek min i pułapek w ontologiach... rdfs:domain i rdfs:range mają bardzo poważne konsekwencje — nie są założeniami do sprawdzenia (które mogą wygenerować błędy jeśli nie będą spełnione) tylko przesłankami prowadzącymi do konkretnych wniosków.

Sieć Semantyczna bliżej niż myślisz(?)

W ramach nadrabiania niewątpliwych zaległości w czytaniu blogów wszelakich trafiłem na jeszcze całkiem świeży tekst o intrygującym tytule Why the World is ready for the Semantic Web. Opinia autora sprowadza się właściwie do zdania: some of the biggest and best projects on the web today are based on Semantic Web principles - they just don't happen to be using Semantic Web technologies. W pierwszej chwili brzmi dosyć głupio, nie da się ukryć... Jednak po zastanowieniu należy chyba przyznać mu rację, a przynajmniej poważnie wziąć pod uwagę przedstawione sugestie.

Ontologie dla laików aka poradnik sapera — odcinek #1

Rozważając praktyczne zastosowania Sieci Semantycznej nie da się uciec od problemu definiowania ontologii, choćby i w OWL. A ponieważ zagadnienie to jest samo w sobie dosyć skomplikowane (choć nie niewykonalne jak widać np. po SchemaWeb) bardzo łatwo popełnić kilka smutnych w konsekwencjach błędów. Zamierzam w tym i kilku następnych wpisach zanalizować, a przynajmniej zapisać sobie ku pamięci, jakie błędy można popełnić przy definiowaniu ontologii, jeśli „zapomni się” zrzucić bagaż codziennego (przynajmniej dla mnie) myślenia kategoriami, które sprawdzają się w systemach informatycznych, ale zupełnie nie pasują do otwartego świata Semantic Web.

DL w OWL wstydliwie skrywane(?)

Przeglądając niedawno rekomendacje W3C dotyczące OWL (a jest ich dziwnie sporo) zastanowiła mnie znikoma ilość (żeby nie powiedzieć całkowity brak) odwołań do formalizmu logiki opisowej (Description Logic), który to podobno jest podstawą OWL DL.

Konferencje

W maju tego roku odbyły się dwie konferencje ciekawe z mojego punktu widzenia. Pierwotnie swoją uwagę skoncentrowałem głównie na JUC2006 Natomiast dosyć małą uwagę przywiązałem w pierwszej chwili do XTech 2006. No i niestety to był błąd. Update [2006.05.22]: rusza konferencja WWW2006.

Dlaczego to nie chwyta, czyli szukanie dziury w 2.0

Im dalej zagłębiam się w różne mniej lub bardziej skomplikowane pojęcia związane z ideą Semantic Web (a do zgłębienia mam jeszcze sporo) tym bardziej zadziwiający wydaje mi się fakt, że tak mało o tych technologiach wie tzw. społeczeństwo (informacyjne bądź co bądź). Zastanawiając się nad sposobem przezwyciężenia takiego stanu rzeczy dochodzę nieodmiennie do wniosku, że jedyna szansa na zainteresowanie ogółu celowością urzeczywistniania idei Sieci Semantycznej to połączenie jej z jakimś marketingowym bełkotem, który „dizajnerzy”, „webdeweloperzy” i przede wszystkim media tak uwielbiają. Z jakimś hasłem, słowem kluczowym, które powtarzane mniej lub bardziej bezmyślne usta osiada w końcu w zbiorowym umyśle warstwą wiedzy powszechnej. Dzisiaj w roli takiego hasła nośnego występuje oczywiście „Web 2.0”.

programista w świecie RDF

O tym, że opis rzeczywistości funkcjonujący w Sieci Semantycznej może być w pewien szczególny sposób interesujący dla programisty już kiedyś wspominałem. Niestety zrobiłem to jak zwykle od środka i poza kontekstem, więc pewnie z czasem nawet ja sam zapomnę o co tam chodziło i dlaczego. Opublikowany stosunkowo niedawno tekst A Semantic Web Primer for Object-Oriented Software Developers natchnął mnie do zrewidowania sprawy i napisania bardziej uporządkowanej (no chociaż troszkę) notatki na temat porównania modelu obiektowego i modelu RDF.

dc:no_ten_jak_mu_tam_wiesz_o_co_chodzi

Nigdy nie byłem specjalnie ufny w stosunku do innych ludzi i publikowanych przez nich informacji, choćby i w publikatorach najpoważniejszych. Taka natura, nic na to nie poradzę. Dlatego czytając niedawno czyjeś wynurzenia na temat równoważności pojęć pewnej ontologii z DublinCore, w której autor przekonywał, że jego cośtam:author może być potraktowany tak samo jak dc:author, poczułem pewne dziwne zaciekawienie. On naprawdę powiedział dc:author?

Po co komu RDF?

Spotykam się od czasu do czasu z zarzutem, że przedstawianie informacji w postaci grafów RDF nie ma wiele sensu. A przenoszenie informacji z relacyjnej bazy danych do modelu RDF to już w ogóle jest jakimś nieporozumieniem. Faktycznie jeżeli chcemy korzystać z jakiegoś zasobu informacji wyłącznie jako ze zbioru danych o określonej strukturze i ustalonym przeznaczeniu to nie ma sensu zapisywać ich w RDF — do tego służą bazy danych i od lat radzą sobie doskonale. Jednak przedstawienie danych w postaci grafu RDF otwiera drogę do wielu ciekawych zastosowań, które w przypadku klasycznej bazy danych są trudne lub wręcz niemożliwe do zrealizowania

Apache DOAP

The Apache Software Foundation prowadzi ogromną ilość projektów, aż chwilami trudno się w nich połapać. Dlatego pomysł powstania strony The Apache Software Foundation Projects jest jak najbardziej uzasadniony. projects.apache.org website facilitates various classifications. This enables discovery of related projects and encourages interaction. Sama idea stworzenia bazy danych o wszelkich prowadzonych projektach jest w miarę oczywista. Natomiast problem pojawia się przy wyborze formatu tej bazy, schematu danych opisujących poszczególne projekty i rozdzieleniu odpowiedzialności za spójność i aktualność informacji. Problemy te zostały rozwiązane w ASF w sposób zaskakująco prosty

Wizje Sieci Semantycznej

W książce „Explorer's Guide to the Semantic Web” Thomas B. Passin pisze: An almost overwhelming number of different ideas exists about the supposed nature of the Semantic Web, and that's the first lesson to learn: The Semantic Web is a fluid, evolving, informally defined concept rather than an integrated, working system. To określenie boleśnie ogólne (dokładnie to samo można powiedzieć o Web 2.0), ale chyba całkiem prawdziwe.

W poszukiwaniu metadanych dokumentów — PDF na początek

Dane (czy właściwie metadane) o dokumentach i publikacjach (zgromadzonych lokalnie lub dostępnych zdalnie) są drugą pokaźną grupą informacji wartych zgromadzenia obok (a może w ramach?) bazy RDF PIM. Posiadanie takich informacji w modelu RDF otwiera drogę do najróżniejszych zastosowań opartych na katalogu zasobów, z automatycznym wyszukiwaniem dokumentów na czele

IsaViz

O pakiecie Graphviz pisałem już kiedyś jako o narzędziu rysowania do diagramów wszelakich jak również wspominałem w kontekście wizualizacji grafu RDF. I właśnie to ostatnie zastosowanie wydaje się dosyć popularne, co jest zresztą całkiem zrozumiałe uwzględniając fakt, że RDF to graf właśnie, a Graphviz jako silnik wizualizacji grafów wszelakich sprawdza się doskonale. Nie dziwne zatem, że właśnie ten pakiet do spółki z ZVTM (do obsługi zoomowalnego interfejsu) i Jena (do obsługi modeli RDF) stanowi podstawę narzędzia IsaViz. Jest to program produkcji W3C (co samo w sobie jest pozytywne o tyle, że licencja W3C jest ideowo zgodna z GPL) służący do edycji i wizualizacji grafów RDF. Zarówno „edycja” jak i „wizualizacja” są tu jednak potraktowane dosyć specyficznie.

web w web

Fala porównań zjawiska „Web 2.0” do „Web nie 2.0” chyba powoli opada (choć miejscami są tacy, co właśnie w tym postanowili się specjalizować, łącznie ze wskazywaniem binarnych wskaźników (sic!)). Podobnie opada fala porównań „Web 2.0” do „Semantic Web” — każdy sobie sam ustalił, które zabija które i rozejm, cisza. Tymczasem ja zupełnie niechcący wpadłem na idealne wręcz ;-) porównanie dlaczego i jak dużo Web 2.0 traci na braku zainteresowania SW. A więc uwaga, skup się, to będzie krótkie, ale treściwe.

Semantic Web at Opera

Wspominałem jakiś czas temu serwis Opera SPARQL Query Engine, a wczoraj zauważyłem blog Semantic Web at Opera. To sugeruje, że Opera Community całkiem poważnie traktuje Sieć Semantyczną i powoli zaczynam wierzyć w slogan „Simply the Best Internet Experience” (choć sam członkiem tego community nie jestem).

meta utopia?

W komentarzach do poprzedniego wpisu pojawiły się dwie interesujące opinie (#8, #9), które zasługują na szerszą odpowiedź... Oba wspomniane komentarze podważają sens publikowania metadanych z powodu naturalnych ułomności ludzi, którzy te metadane będą produkować. Ja się oczywiście zgadzam, że ludzie są w kwestii podawania prawdy tak samo beznadziejni jak w systematyczności. Jednak opisywana przez Dr Lex'a meta utopia opiera się wg mnie na dwóch założeniach, które skazują ją na klęskę: istnienie ustalonego słownika metadanych, np. via DTD,poleganie wyłącznie na dobrych intencjach autora (meta)danych. Jednak moje marzenie o wyszukiwarce nie opierało się jedynie na rozpowszechnieniu metadanych, lecz na wykorzystaniu Sieci Semantycznej. A w niej oba powyższe założenia z definicji nie istnieją.

Szukajcie a znajdziecie?

Google jest do dupy i tyle. Co z tego, że to najlepsza dzisiaj wyszukiwarka internetowa, skoro i tak jest to program żałośnie wręcz tępy. Zupełnie nie spełnia moich oczekiwań i wyobrażeń na temat wyszukiwania informacji w Internecie...

RDF PIM — odcinek #2: pozyskiwanie kolejnych danych

Prawdopodobnie eksperyment polegający na stworzeniu bazy wszelakich danych osobistych w postaci modelu RDF (aka RDF PIM) jest interesujący wyłącznie dla mnie. Skoro jednak powiedziało się kiedyś „odcinek #1” to wypada przynajmniej zasygnalizować kolejne numerki... A zatem pozyskiwania danych do bazy RDF PIM ciąg dalszy.

RDF PIM — odcinek #1: pozyskiwanie danych

Dobra, starczy tych mało przekonujących przykładów dla ludzi posiadanych przez koty — zobaczmy czy ten cały bajzel z SW nadaje się do czegoś naprawdę użytecznego. ;-)

RSS 1.0 w rękach maniaka

Fakt należący do tych, które dla jednych są banalnie oczywiste, a dla innych mogą być zaskoczeniem: pomimo identycznie brzmiącego akronimu różne wersje RSS to zupełnie inne formaty. Przeznaczenie wszystkich jest w zasadzie takie samo, jednak wbrew pozorom nie są to kolejne wersje tej samej specyfikacji, lecz kompletnie inne rozwiązania. Ten drobny fakt, zapewne jest zupełnie nieistotny z punktu widzenia programów agregujących kanały RSS. Jednak dla zastosowań Sieci Semantycznej może mieć ogromne znaczenie.

Łączenie grafów RDF w praktyce

Skoro RDF umożliwia zapisywanie wszelkich danych, to oznacza, że również wyrażeń logicznych i reguł.Reguły takie mogą opisywać cokolwiek, np. ... zasady wyznaczania punktów wspólnych łączonych grafów. Jak każde inne wyrażenia, stanowią one część modelu, ale jednocześnie mogą zostać wykorzystane do modyfikowania jego zawartości. Mamy zatem w samym modelu/zbiorze danych informację o tym jak należy przeprowadzić jego agregację. Wystarczy dysponować (względnie) prostym mechanizmem wnioskującym...