La quantité d’informations grandit chaque jour d’avantage sur le web et le moyen le plus efficace aujourd’hui pour naviguer parmi ce flot incessant de données, la recherche par mots-clef, risque de se montrer moins précise et pertinente dans un futur proche. Certains affirment même que la recherche par mots-clef délivre déjà des résultats moins judicieux. Son évolution sur le tableau ci-dessus réalisé par Nova Spicak. Spivack est le CEO et fondateur de la startup sémantique Radarnetwoks et tente de pousser les recherches dans ce sens. Tous ceux qui sentent déjà que cela prend aujourd’hui un peu plus de temps sur Google pour trouver un résultat exact seront intéressés par cette analyse.
“La recherches par mots-clef est OK” dit-il, “mais l’information continue son explosion et nous avons besoin de quelque chose de mieux.” Aujourd’hui il existe 1,3 milliards de personnes sur le web et de 100 millions de sites web actifs. L’information ne cesse d’augmenter proportionnellement sur le web afin de repondre à la demande, de plus, les utilisateurs ont désormais le besoin de partager leur propre information.
Quand nous aurons des milliards et des milliards de pages, la recherche par mot-clef ne suffira plus. Spivack précise:
“Nous cherchons un résultat précis, une aiguille dans la botte que nous renvoie les moteurs de recherche. Le problème est qu’aujourd’hui sur Google seuls les pages les plus citées sont mises en avant. Parmi toutes les “meilleures “pages citées en première page, pas sur de trouver exactement ce que l’on recherche. C’est parce que les moteurs ne comprennent pas votre question. Ils trouvent les pages qui correspondent aux mots-clefs. “
Alors, comment allons nous plus loin qu’avec les mots-clefs et le Google Page Rank? Plusieurs approches sont tentées: recherche sociale, tagging, recherche guidée, recherche en langage naturel, méthodes statistiques, recherche ouverte, sémantique, et même par intelligence artificielle. Ils ont tous leurs inconvénients. Les Tags sont imprecis et inconsistants. La recherche par langage naturel demande trop de calculs et est difficile à mesurer. La recherche sémantique est sans doute la plus prometteuse mais cela demande de réécrire chaque page du web existante.
Spivack nous a livré une présentation impressionnante sur la recherche sémantique à Amstrerdam durant la NextWeb conference. Retrouvez la présentation sur le SlideShow ci-dessous. Le web sémantique est essentiellement une série de standards qui aideront les ordinateurs à retirer un immense flot d’informations sur le web. Grâce à l’intégration d’intelligence dans les données:
“Faire pour les données ce que le web a fait pour les documents.Vous transformez le web en database, et votre propre data en fait partie et fait partie d’une base de données mondiale. Passant de données vers d’autres comme vous passez d’une page web à l’autre. “
Il existe encore de nombreux obstacles à l’adoption du web sémantique; mais ce qui est sur c’est que la recherche doit évoluer et Google, Yahoo et Microsoft avec. La question est de savoir si Google, par exemple, est trop lié aux mots-clefs pour pouvoir faire autre chose?





J’ai eu la chance de rencontrer Nova Spivack à San Francisco en Janvier dernier et j’ai filmé et publié sa présentation. Les slides ne sont pas facile à comprendre sans les explications de Nova.
Par contre Twine n’est pas un moteur de recherche, je dirais plutôt que c’est un manager de contenu personnel. Si vous voulez des exemples de moteur de recherche web sémantique vous pouvez commencer par jeter un oeil à TrueKnowledge.
Et si tout simplement vous voulez en savoir plus sur le web sémantique, qu’une seule adresse:
http://websemantique.org
Vraiment un très bon billet sur un sujet qui fait beaucoup parler de lui et qui va de plus en plus s’amplifier. Pour ma part je commence sérieusement à m’y intéresser pour ma part et à réfléchir à des solutions.
Il est vrai que la recherche tel qu’on la connais maintenant, si puissante soit-elle, aura une fin, et cette “fin” est plus ou moins proche. Les techniques s’améliorent, et une (meilleure) solution que les mots-clefs sera trouvé.
Est-ce que Google saura réagir, saura s’adapter assez rapidement pour rester dans la course (Google mais aussi les autres) ou est-ce qu’un nouveau moteur révolutionnaire ferait son apparition et prendrait la place de Google (comme ce dernier l’avais fait face à Yahoo).
Jusque maintenant on a vu qu’il fallait vite s’adapter pour rester dans le tir.
Pour revenir sur un plan plus technique sur la recherche de ces nouvelles solutions de recherche, effectivement il y a plusieurs avantages et inconvénients à chaque “techniques” proposés. Il faudra trouver quelque chose de plus progressif pour ne pas bouleverser toutes les habitudes des internautes, mais aussi des webmasters.
Bref un sujet vraiment très intéressant que je vais suivre avec plaisir. Pour ma part je n’ai pas encore de solutions concrètes mais je continue à y réfléchir car c’est un sujet que j’apprécie.
Mouais… La recherche sémantique c’set bien mais la plupart des users ne prendront pas le temps de remplir un formulaire de recherche complexe quand on voit qu’ils sélectionnent même pas la lanbgue de leur pays pour les recherches….
Et sans formulaire de recherche avancé, c’set pas mieux que la recherche classique…
Comme la recherche en langage naturel… Vous pensez que les gens vont taper “quel est l’âge de bill clinton” au lieu de taper “age clinton”?
“Certains affirment même que la recherche par mots-clef délivre déjà des résultats moins judicieux.”
Véronis,études à l’appui, dit exactement l’inverse.
On peut aussi citer dans les projets de moteurs de recherche avec utilisation du langage naturel une startup californienne Powerset qui est en train de développer une version de test pour l’instant uniquement basé sur Wikipedia US/UK.
Les résultats sont plutôt intéressants. Il est possible de s’inscrire pour tester la version bêta.
http://www.powerset.com
https://labs.powerset.com/
@John
La recherche sémantique n’implique pas forcément de poser une question complète. La différence majeure pour une même requête “age de Clinton” dans deux moteurs (l’un avec mots clés et l’autre sémantique) est la prise en compte du “de” qui ne sera pas ignoré par la version sémantique et qui spécifiera bcp plus les résultats attendus.
La précision risque donc de s’améliorer et ont espère obtenir un nombre de “relevant documents” bcp plus élevé.
Si l’avancée majeure du web sémantique est de pouvoir interpréter une requête avec un taux de précision plus élevé, cela va de pair avec l’instauration d’un système collaboratif qui implique l’utilisateur dans la recherche.
Dès que ce pas est franchi, faudra se poser la question pour savoir si la manipulation de ces informations ne causera pas de dérives au niveau de la gestion des données privées comme nous ont habitués les plus grands acteurs du web, car une évolution dans un domaine ne doit jamais être faite aux dépends d’un autre.
En tout cas j’ai regarder les screencast et les liens que tu propose Nicolas Cynober, et c’est vraiment intéressant. Je ne connaissais pas du tout ces moteurs, et je doit dire que je suis assez bluffé.
On tape une phrase précise et on a une réponse simple et claire. Dans bien des cas ce genre de moteur n’est pas utile, mais à contrario, dans beaucoup de cas ce genre de moteur peut se révéler utile. Combien de fois avez vous eu à chercher une information précise, mais que vous ayez du vous taper des tas de résultats pour trouver une réponse simple.
Rien que ce genre de moteur (encore en développement) c’est déjà très impressionnant et très utile dans pas mal de cas et pourtant ce n’est que le premier pas vers un web (et en l’occurrence un moteur de recherche) sémantique ! Et pour ma part je trouve ça encourageant.
Reste à améliorer le concept car tout les sites ne sont pas sémantiques, ensuite il faut pouvoir proposer une recherche sémantique globale (et pas uniquement pour une réponse précise à une question précise) mais en tout cas les pistes sont la je pense.
Il y a déja les encyclopedie pour les recherche préscice
l’utilisateur sur une expression regarde la première page environ, puis change d’expression pour trouver quelque chose de précis, si sur 3 ou 4 expressions, il ne trouve rien avec google c’est qu’il n’y plus rien a voir, google est quand meme déja très efficace
+1. Perso, je trouve quasiment tout avce Google et rapidement… Bon ensuite ça peut être utile pour les casual surfers mais le revers de la médaille, c’est que les webmasters doivent structurer leurs données… C’set très lourd… Alors structurer pour du commercial ok… Mais tout ce qui est documentaire ou informationnel, bref l’essentiel de la recherche d’information sémantique, on risque pas d’y arriver.
Le web sémantique est typiquement une technologie et une avancée systémique (dépendante d’un écosystème). Mais les progrès sur ces 6 derniers mois sont considérables. Il faudra encore 1 ou 2 ans pour que ce nouveau web devienne incontournable dans le paysage. Regardez le slide de Nova, il place la période “web sémantique” seulement à partir de 2010. Vous ne trouverez donc à l’heure actuelle que les ébauches d’un web futur, un web bien plus ouvert et hautement interconnecté.
[...] D’après TechCrunch, [...]
[...] D’après TechCrunch, [...]