Obecnie w Internecie jest dostępnych ok. 8 mld stron, należących głównie do osób indywidualnych oraz małych i średnich firm – twierdzą analitycy z Debian Inc. Liczbę witryn i podstron w sieciach korporacyjnych, do których zwykłe wyszukiwarki nie mają dostępu, szacuje się na ok. 10 mld. Z tego do prostego przeszukiwania nadaje się najwyżej 30 proc.
Ilość zgromadzonych informacji jest tak duża, że ani użytkownicy, ani dostępne dotąd na rynku rozwiązania nie są w stanie sprawnie się wśród nich poruszać. Zaczynają się więc rozwijać nowe techniki wyszukiwania i prezentowania informacji. Najważniejszą z nich jest semantyka.
Wyszukiwarki Web 3.0, oparte na semantyce, mają w sposób inteligentny i elastyczny przeszukiwać sieć w odpowiedzi na pytanie zadane w języku naturalnym i znajdować wyniki powiązane ze sobą znaczeniowo. Pierwsze aplikacje tego typu są już testowane. Jest to m.in. Wolfram Alpha, czyli nienazwany jeszcze projekt Google’a, czy PowerSet, teraz pod logo Microsoftu, który przejął tę firmę w lipcu 2008 r. Koncern z Redmond chce na podstawie PowerSet rozwijać własne technologie Web 3.0. Jak jednak informuje branżowy serwis The Register Bing, nowa wyszukiwarka Microsoftu obecnie w ograniczonym stopniu obsługuje technologie semantyczne.
Ale rozwiązania takie to nie tylko domena największych firm w branży IT. Polski Prokom jest jednym z udziałowców spółki pracującej nad wyszukiwarką internetową nowej generacji Hakia. Potrafi ona przetwarzać pytania zadawane w języku naturalnym.
[srodtytul]Przydadzą się wszędzie[/srodtytul]
Z semantyki coraz częściej korzystają firmy m.in. z branży finansowej czy telekomunikacyjnej. Według analityków IDC w następnej dekadzie technologie semantyczne i Web 3.0 zostaną wdrożone w systemach i aplikacjach dla przedsiębiorstw, zarówno wspierających zarządzanie, jak i typu business intelligence (ERP, CRM, SCM, BPM/BPMS). Prawdopodobnie najszybciej staną się standardem w rozwiązaniach korporacyjnych, wszędzie tam, gdzie gromadzona jest duża ilość danych.
Zastosowania semantyki w informatyce nie kończą się na wyszukiwarkach. Semantyczne usługi sieciowe ułatwiają wykonywanie wielu pracochłonnych zadań. Wykorzystuje je branża ubezpieczeniowa, finansowa, telekomunikacja. Jednym z zastosowań jest optymalizacja kosztów zarządzania ryzykiem i dostosowanie systemów firmowych do standardów i wytycznych związanych z AML (Anti Money Laundering, czyli analiza nadużyć), KYC (Know Your Customer), EDD (Enhanced Due Diligence) czy z zarządzaniem ryzykiem operacyjnym (Operational Risk).
W Citigroup technologie semantyczne wykorzystywane są do analizy trendów, wspierają pracę maklerów i analityków finansowych. American Financial stosuje semantyczne silniki reguł biznesowych do budowania strategii inwestycyjnych dla indywidualnych klientów. Zapewne niedługo rozwiązania semantyczne będą na większą skalę używane także przez firmy telekomunikacyjne. Już obecnie wdrażane są one we France Telecom, British Telecom oraz T-Mobile (niemiecki operator komórkowy).
[srodtytul]Cyfrowy doradca klienta[/srodtytul]
Kolejnym, najbardziej popularnym poza wyszukiwarkami, zastosowaniem semantyki są syntezatory mowy oraz tzw. chatterboty, czyli wirtualni doradcy, którzy potrafią porozumiewać się z użytkownikami sieci w języku naturalnym. Zwykle takie rozwiązania są wykorzystywane w działaniach marketingowych. Służą jako wirtualny przewodnik po serwisie WWW, doradca klienta w help desk czy konsultant w call center. Pełnią rolę rzecznika prasowego firmy, udzielają informacji o wyrobach i usługach. Ostatnio aplikacje wirtualnego doradztwa instalowane są także w usługach typu lifestyle, np. w serwisach randkowych.
Rozwiązania te są dostępne cenowo nawet dla firm średnich. Do ich największych wytwórców należą firmy polskie.
Chatterboty produkuje m.in. Stanusch Technologies. Są one wyposażone w mechanizm współpracy z innymi systemami wspomagającymi zarządzanie (np. CRM lub ERP) lub bazami danych. Mogą służyć zarówno firmie prowadzącej serwisy internetowe (np. randkowe), jak i zajmującej się sprzedażą wyspecjalizowanego sprzętu, np. medycznego.
Inną firmą, która ma już spore osiągnięcia w dziedzinie syntezatorów mowy, jest IVO Software z Gdyni. Zbudowany w całości przez tę spółkę syntezator Ivona oferuje jakość głosu porównywalną z mową ludzką. Posługuje się już trzema językami: polskim, angielskim i rumuńskim. Firma jest także autorem programu Expressivo (obecnie wersja1.4.4), który integruje się z Microsoft Word 2007. Jest to nakładka na Worda umożliwiająca czytanie dokumentów syntezowanym ludzkim głosem. Jest przeznaczona dla osób niewidomych i niedowidzących.
Oprogramowanie IVO Software zostało już zainstalowane przez Finnsoft w telefonicznym centrum obsługi klienta Deutsche Banku. NextiraOne wykorzystała je w infolinii Straży Granicznej. Głosy Ivona możemy usłyszeć np. w bankomatach Lukas Banku, na peronach warszawskiego metra, w supermarketach SPAR czy windach firmy Otis. Firma Wind Telecom wdrożyła ten syntezator w telekomie rumuńskim.
[srodtytul]Są pieniądze z Unii Europejskiej[/srodtytul]
Inicjatywy tworzenia rozwiązań semantycznych wspomagają fundusze inwestycyjne, wśród nich polski fundusz technologiczny IIF, działający głównie na rynkach Europy Wschodniej. Obecnie jest realizowany projekt, który ma pomagać użytkownikom w wyszukiwaniu produktów spełniających ich potrzeby konsumenckie. Druga podobna inwestycja to wsparcie projektu Personal TV, bazującego na technologiach personalizacji. Jego celem jest udostępnienie gospodarstwom domowym telewizji cyfrowej.
Rozwój technologii semantycznych wspiera Unia Europejska. W Siódmym Programie Ramowym (2007 – 2013) zagwarantowano na badania 50 mln euro rocznie. Łącznie z różnych źródeł do 2013 r. na ten cel ma być przeznaczone 500 mln euro. Prace dotyczą wykorzystania semantyki w rozwiązaniach telekomunikacyjnych, w administracji publicznej oraz w przemyśle.
W europejskim projekcie MOST, realizowanym w ramach Siódmego Programu, bierze udział krakowska firma Comarch. Bada ona przyszłą rolę ontologii w systemach OSS (Operations Support Systems).
W dużych projektach europejskich uczestniczy też firma Software Mind. Poza tym sprzedaje ona na unijnym rynku swoje rozwiązania, kilkakrotnie już nagradzane za innowacyjność. Od 2005 r. współpracuje z brytyjską firmą Garlik, tworząc platformę DataPatrol służącą do weryfikacji i elektronicznej ochrony tożsamości użytkowników Internetu.
Zdaniem specjalistów wdrożenia rozwiązań semantycznych nie są kosztowne, zwłaszcza jeśli chodzi o ewentualną rozbudowę infrastruktury w przedsiębiorstwie. Dzięki temu będą dostępne dla większości polskich firm.
[ramka][srodtytul]Co to jest semantyka[/srodtytul]
To dyscyplina badająca relacje między znakami a przedmiotami, do których się one odnoszą. Zajmuje się badaniem znaczenia słów, czyli interpretacją znaków oraz zdań i wyrażeń języka. Semantyka logiczna (nazywana też czasem teorią modeli) bada języki sztuczne.
W przypadku stron WWW semantyka oznacza kod XHTML, który jest „zrozumiały” dla komputerów przetwarzających go. Dzięki niemu przeglądarki lepiej rozumieją strukturę dokumentu i rolę jego poszczególnych fragmentów, mogą lepiej przedstawić stronę użytkownikowi i pomóc w nawigacji (np. zrobić spis treści dokumentu na podstawie nagłówków, podpowiadać rozwinięcia skrótów, umożliwić przeskakiwanie do następnego akapitu lub elementu listy w przeglądarkach głosowych itp.).
źródło: browsehappy.pl[/ramka]
[ramka][srodtytul]Pracują mali i duzi[/srodtytul]
Prace nad rozwiązaniami semantycznymi prowadzą największe firmy informatyczne i informacyjne, takie jak Google, Microsoft, Yahoo, DowJones i IBM. W branży tej działają też małe i średnie przedsiębiorstwa. Pochodzą głównie z USA, Korei Południowej, Francji i Wielkiej Brytanii, ale również z Izraela i Polski.[/ramka]
[ramka][srodtytul]Łukasz Osowski, prezes IVO Software[/srodtytul]
Wachlarz zastosowań syntezatora mowy w biznesie jest niezwykle szeroki. Stosuje się go m.in. w telekomunikacji. Za pomocą klawiatury komputerowej, w wygodny i szybki sposób można stworzyć powitania i komunikaty głosowe dla centrali telefonicznej w każdej firmie.
Takie usługi dla swoich klientów biznesowych świadczy już m.in. sieć komórkowa PTC Era, operator telefonii internetowej FreecoNet i producent tradycyjnych centralek abonenckich Slican. Syntezator mowy jest także nieodłącznym składnikiem coraz bardziej popularnych wirtualnych asystentów obecnych na stronach internetowych, np. w serwisie grupy Ergo Hestia. Bywa, że ludzie nie są świadomi, że mówi do nich syntezator mowy.
Syntezator jest również obecny w serwisach internetowych. Dzięki niemu w portalu Onet.pl możemy odsłuchać treści serwisów informacyjnych. A w internetowym słowniku MEGAslownik.pl słyszymy poprawną wymowę wyrażeń obcojęzycznych.
Przedsiębiorcy są też zainteresowani wykorzystaniem syntezy mowy np. przy tworzeniu profesjonalnych podkładów lektorskich do prezentacji multimedialnych, filmów promocyjnych czy materiałów dydaktycznych.[/ramka]
[ramka][srodtytul]Grzegorz Młynarczyk,wiceprezes Software Mind[/srodtytul]
Rozwiązania semantyczne można już stosować bez dużych nakładów. Niezbędny jest jedynie szerszy dostęp do różnych źródeł informacji, co może się okazać problemem. W wielu przedsiębiorstwach silosy informacyjne są zamknięte w obawie przed włamaniem do zasobów firmowych. Jednak otwarcie ich, przy odpowiednim zabezpieczeniu, daje wiele korzyści, jeśli stosuje się technologie semantyczne. Część zasobów musi być dostępna, aby mogła być przeszukana i powiązana z innymi, zewnętrznymi źródłami informacji.
Najszybszą metodą zastosowania technologii semantycznych jest oczywiście wsparcie obecnie istniejących procesów w przedsiębiorstwach. Tak dzieje się w medycynie, finansach czy telekomunikacji. Technologie te mogą być używane w systemach wspierających zarządzanie infrastrukturą przedsiębiorstw, zorientowanych na usługi (Semantic SOA), w systemach CRM, SCM, PLM, ERP, w systemach zarządzania wiedzą, wspierających podejmowanie decyzji, zarządzanie ryzykiem operacyjnym, monitorujących nadużycia finansowe, usprawniających zarządzanie sytuacjami kryzysowymi. W zasadzie chodzi o wszystkie sytuacje, w których prosta prezentacja danych nie jest już wystarczająca, a ilość danych jest znacznie większa niż możliwości percepcyjne człowieka. [/ramka]