Une nouvelle journée historique pour le moteur de recherche sémantique Powerset; avec le lancement aujourd’hui d’une présentation de cette nouvelle expérience recherche pour l’utilisateur. Pour l’instant, Powerset ne recherche que parmi les pages Wikipedia et complète avec des données de Freebase. Le produit a été lancé un jour après des premières rumeurs de rachat.
Difficile d’annoncer si Powerset sera aussi surprenant et innovant que Google à ses débuts. Et comme il se limite à Wikipedia; il n’est pas possible de véritablement juger la capacité de leur algorithme à déterminer les bons des mauvais résultats.
Ce que l’on peut juste constater actuellement c’est sa rapidité à réunir de l’information rapidement.
Par exemple, pour la recherche” quand a eu lieu un tremblement de terre à Tokyo?”, les résultats sont étonnamment rapides. Plus précis et rapides que sur Google pour la même recherche. C’est que Powerset ne se contente pas de chercher les mots-clefs, il détecte le sens du contenu présent sur les pages wikipedia.

Les réponses précises à vos questions apparaissent directement dans les extraits d’articles présentés sur la page des résultats. De plus, Freebase complète les résultats avec d’autres données afin d’affiner ces mêmes resultats. Ainsi apparaissent sur une recherche”Bill Clinton” toutes sortes d’actions ou de mots en rapport avec la personne, qui permettent de continuer et de préciser la recherche.

Powerset indexe le web différemment en essayant d’analyser le sens des pages qui pourraient correspondre aux recherches. Powerset à la différence des autres moteurs ne s’arrêtent pas uniquement sur les mots-clefs.
Mais cette méthode coûte encore plus d’argent, de ressources et de temps. C’est pourquoi ils n’ont pas encore indexé tout le web et viennent de lever $12,5 millions supplémentaires. Et pour continuer, ils devront trouver de nouveaux fonds encore.
Malgré les critiques nombreuses, Powerset maintient le cap et tente de présenter un moteur de recherche révolutionnaire. La société a créé cette vidéo-démo ci-dessous:
Note d’Ouriel: dans la série Teasing, PowerSet est certainement le champion intergalactique; cela fait plusieurs mois que la startup génère un buzz important sur plusieurs blogs (dont Techcrunch US) alors que le produit n’était même pas disponible en beta privée. Il est désormais possible de tester le service. Après quelques tests je reste sur ma faim. Je n’ai pas trouvé les résultats particulèrement pertinent entre une requête par mot clé et requête naturelle. En revanche le design du site et l’ergonomie sont tous simplement exceptionnels et il est bien plus confortable de naviguer sur Wikipedia via Powerset que Wikipedia lui même. L’index est encore inexistant, attendant donc de voir ce que cela va donner une fois une powerset disponible sur d’autres sites. En attendant la société aurait déjà des candidats à son rachat…




Je souhaite relativiser 2 choses sur cet article :
Premièrement, on ne peut pas comparer la rapidité d’un moteur qui ne tire ses résultats que de deux sources (wikipedia avec moins de 7 millions d’articles et freebase), qui sont par ailleurs très bien structurées et qu’on sait bien traiter, face à un moteur web qui est face à plusieurs milliards de pages avec des données très faiblement structurées (d’où la difficulté à passer au sémantique, qui est liée au contexte…)
Deuxièmement c’est une idée très répandue et pourtant fausse que de penser que les moteurs web indexent la totalité du web, qui grandit bien trop vite pour ça. En science du web, on évalue à environ 1% l’indexation du web, même par Google ! (cf. Bergman M.K., “The deep web: surfacing hidden value”, 2001, http://www.brightplanet.com/pdf/deepwebwhitepaper.pdf)
@Ouriel: dans le même ordre d’idée, tu as certainement eu l’occasion de tester True Knowledge. Je reste un poil frustré [comme tu peux l'être sur PowerSet], la prise en main “participative” étant assez ardue pour l’utilisateur commun (imho). Qu’en penses-tu ?
1% ?? Impressionant !
Bon en tout cas, Powerset ne sait pas comment on fait les bébés apparemment
Il est sûr que c’est limité et frustrant, mais il faut bien commencer par quelque chose. En attendant, le web sémantique continue son petit bonhomme de chemin.
Mais tout cela appelle deux questions à mon sens :
- nos exigences sur le search, la couverture et la profondeur requise pour jouer ce jeu sont tels que vouloir d’emblée jouer la comparaison d’avec Google me semble vain. Il le faudra bien un jour, mais se réduire à un écosysthème (Wikipedia ici) a le mérite de pouvoir dresser une comparaison entre méthodes (et modèles) plus qu’entre résultat. À ce titre, la remarque de Radicaliste au regard de la “Recherche par la foule” me semble assez bienvenue, tant sur l’expérience utilisateur et ses pré-requis, que dans la comparaison des modèles
- j’ai joué avec PowerSet en français et ça ne le fait pas. Si l’on va dans le domaine du sens, on ne peut éluder la question des cultures et des langues avec une dimension bien plus exigeante que d’indexer des mots. De fait, j’ai bien peur d’un effet d’accélération sur le contenu anglophone qui cristallise un peu plus nos faiblesses structurelles dans l’économie de la connaissance …
Un peu décevant pour l’instant.
Le moteur existe, l’aspect sémantique reste encore à démontrer. L’exemple des tremblements de terre est mal exposé, puisque visiblement la recherche a été effectuée en anglais (earthquake). La question ‘quand a eu lieu un tremblement de terre à Tokyo?’ ne donne rien de concret.
A suivre.
Trop lent…. Mais techno intéressante bien que très limitée… Et pis chez Wikipedia, tout est presque structuré, c’est trop facile
Trouvé sur le site Usearch consacré aux moteurs de recherche.
http://www.usearch.be/2/
Le moteur de recherche sémantique “TrueKnowledge” qui est encore indisponible.
http://www.trueknowledge.com/
Hmmmm!!Je préfère attendre qu’il tire ses résultats de plus de sources que Wikipédia et Freebase.
On peut pas juger qu’une technologie soit bien juste parce que tout le monde est impatient de la voir en action.
Pour l’instant c’est pas très satisfaisant tout ça et c’est loin des promesses de pertinence et de choix qu’on nous à présenté sur cette technologie, mais je lui donne le bénéfice du doute en attendant une amélioration des sources et résultats.
En remarquant aussi que ce n’est que la premiere boite à ouvrir son moteur sémantique
Moi je pense qu’il faut lui laisser sa chance.
@Sebastien Premierement, PowerSet n’a pas les mêmes ressources que Google, deuxiemement ton article date de 2001, soit 7 ans ! On l’a bien révolutionner le web depuis.
Immaginons que plus tard, PowerSet nous permette d’améliorer son système en ajoutant nous même ce qu’on aurait voulu trouver, il se peut que ce système devienne vraiment puissant.
[...] Cela fait quelques temps que Powerset est sorti de sa beta privée, mais il n’est jamais trop tard pour jeter un oeil à ce joli [...]
En effet Powerset n’a pas les mêmes ressources que Google mais comme je le dis dans ce screencast et dans les commentaires qui s’en suivent, Powerset a décidé de développer son architecture de datacenter sur un mode opensource. L’objectif de Powerset est très clairement le “search” à grande échelle.
L’équipe a l’air solide, on sait jamais …
[...] avait été lancé à Techcrunch 40 l’année dernière et avait propose une première démonstration de sa technologie au public l’année [...]
[...] autour des 100 millions de dollars. Powerset avait récemment lancé une version de son moteur de recherche pour Wikipedia, à l’interface étonnante mais aux résultats pas si [...]
[...] encyclopédie communautaire Wikipédia. Une présentation de celui ci à été faite par le blog TechCrunch lors de la journée officielle de présentation de Powerset. Voilà une affaire à suivre dans la [...]
bonjour à tous,
il me semble que le jour ou a ete présenté le 1er calculateur électronique,peu de gens à l’époque devaient se douter de ce qui pouvait etre fait pour l’ameliorer pour qu’il soit comme aujourd’hui, environ 60 ans aprés non?
[...] Ci promettono un salto qualitativo con l’ arrivo dei motori di ricerca semantica, che saranno capaci di analizzare il contenuto che essi indicizzano, e non si limiteranno più soltanto a produrre dei link. Ma questa tecnologia è ancora solo ai primi balbettii… [...]