12 mai 2008

Première présentation de Powerset, le moteur de recherche sémantique

Rédigé par Michael Arrington (adaptation: Alain Eskenazi)

Une nouvelle journée historique pour le moteur de recherche sémantique Powerset; avec le lancement aujourd’hui d’une présentation de cette nouvelle expérience recherche pour l’utilisateur. Pour l’instant, Powerset ne recherche que parmi les pages Wikipedia et complète avec des données de Freebase. Le produit a été lancé un jour après des premières rumeurs de rachat.

Difficile d’annoncer si Powerset sera aussi surprenant et innovant que Google à ses débuts. Et comme il se limite à Wikipedia; il n’est pas possible de véritablement juger la capacité de leur algorithme à déterminer les bons des mauvais résultats.

Ce que l’on peut juste constater actuellement c’est sa rapidité à réunir de l’information rapidement.

Par exemple, pour la recherche” quand a eu lieu un tremblement de terre à Tokyo?”, les résultats sont étonnamment rapides. Plus précis et rapides que sur Google pour la même recherche. C’est que Powerset ne se contente pas de chercher les mots-clefs, il détecte le sens du contenu présent sur les pages wikipedia.

Les réponses précises à vos questions apparaissent directement dans les extraits d’articles présentés sur la page des résultats. De plus, Freebase complète les résultats avec d’autres données afin d’affiner ces mêmes resultats. Ainsi apparaissent sur une recherche”Bill Clinton” toutes sortes d’actions ou de mots en rapport avec la personne, qui permettent de continuer et de préciser la recherche.

Powerset indexe le web différemment en essayant d’analyser le sens des pages qui pourraient correspondre aux recherches. Powerset à la différence des autres moteurs ne s’arrêtent pas uniquement sur les mots-clefs.

Mais cette méthode coûte encore plus d’argent, de ressources et de temps. C’est pourquoi ils n’ont pas encore indexé tout le web et viennent de lever $12,5 millions supplémentaires. Et pour continuer, ils devront trouver de nouveaux fonds encore.

Malgré les critiques nombreuses, Powerset maintient le cap et tente de présenter un moteur de recherche révolutionnaire. La société a créé cette vidéo-démo ci-dessous:

Note d’Ouriel: dans la série Teasing, PowerSet est certainement le champion intergalactique; cela fait plusieurs mois que la startup génère un buzz important sur plusieurs blogs (dont Techcrunch US) alors que le produit n’était même pas disponible en beta privée. Il est désormais possible de tester le service. Après quelques tests je reste sur ma faim. Je n’ai pas trouvé les résultats particulèrement pertinent entre une requête par mot clé et requête naturelle. En revanche le design du site et l’ergonomie sont tous simplement exceptionnels et il est bien plus confortable de naviguer sur Wikipedia via Powerset que Wikipedia lui même. L’index est encore inexistant, attendant donc de voir ce que cela va donner une fois une powerset disponible sur d’autres sites. En attendant la société aurait déjà des candidats à son rachat

  • AddThis Social Bookmark Widget

16 Commentaires

Flux RSS des commentaires de cet article.

  1. Commentaire de Sebastien — 12 mai 2008 @ 10:21

    Je souhaite relativiser 2 choses sur cet article :

    Premièrement, on ne peut pas comparer la rapidité d’un moteur qui ne tire ses résultats que de deux sources (wikipedia avec moins de 7 millions d’articles et freebase), qui sont par ailleurs très bien structurées et qu’on sait bien traiter, face à un moteur web qui est face à plusieurs milliards de pages avec des données très faiblement structurées (d’où la difficulté à passer au sémantique, qui est liée au contexte…)

    Deuxièmement c’est une idée très répandue et pourtant fausse que de penser que les moteurs web indexent la totalité du web, qui grandit bien trop vite pour ça. En science du web, on évalue à environ 1% l’indexation du web, même par Google ! (cf. Bergman M.K., “The deep web: surfacing hidden value”, 2001, http://www.brightplanet.com/pdf/deepwebwhitepaper.pdf)

  2. Commentaire de radicaliste — 12 mai 2008 @ 10:50

    @Ouriel: dans le même ordre d’idée, tu as certainement eu l’occasion de tester True Knowledge. Je reste un poil frustré [comme tu peux l'être sur PowerSet], la prise en main “participative” étant assez ardue pour l’utilisateur commun (imho). Qu’en penses-tu ?

  3. Commentaire de Ek0 — 12 mai 2008 @ 10:53

    1% ?? Impressionant !

    Bon en tout cas, Powerset ne sait pas comment on fait les bébés apparemment :)

  4. Commentaire de Alexis Mons — 12 mai 2008 @ 11:04

    Il est sûr que c’est limité et frustrant, mais il faut bien commencer par quelque chose. En attendant, le web sémantique continue son petit bonhomme de chemin.
    Mais tout cela appelle deux questions à mon sens :
    - nos exigences sur le search, la couverture et la profondeur requise pour jouer ce jeu sont tels que vouloir d’emblée jouer la comparaison d’avec Google me semble vain. Il le faudra bien un jour, mais se réduire à un écosysthème (Wikipedia ici) a le mérite de pouvoir dresser une comparaison entre méthodes (et modèles) plus qu’entre résultat. À ce titre, la remarque de Radicaliste au regard de la “Recherche par la foule” me semble assez bienvenue, tant sur l’expérience utilisateur et ses pré-requis, que dans la comparaison des modèles
    - j’ai joué avec PowerSet en français et ça ne le fait pas. Si l’on va dans le domaine du sens, on ne peut éluder la question des cultures et des langues avec une dimension bien plus exigeante que d’indexer des mots. De fait, j’ai bien peur d’un effet d’accélération sur le contenu anglophone qui cristallise un peu plus nos faiblesses structurelles dans l’économie de la connaissance …

  5. Commentaire de René GENEVIEVE — 12 mai 2008 @ 10:56

    Un peu décevant pour l’instant.
    Le moteur existe, l’aspect sémantique reste encore à démontrer. L’exemple des tremblements de terre est mal exposé, puisque visiblement la recherche a été effectuée en anglais (earthquake). La question ‘quand a eu lieu un tremblement de terre à Tokyo?’ ne donne rien de concret.
    A suivre.

  6. Commentaire de John — 13 mai 2008 @ 7:02

    Trop lent…. Mais techno intéressante bien que très limitée… Et pis chez Wikipedia, tout est presque structuré, c’est trop facile ;)

  7. Commentaire de jack — 13 mai 2008 @ 8:46

    Trouvé sur le site Usearch consacré aux moteurs de recherche.
    http://www.usearch.be/2/

    Le moteur de recherche sémantique “TrueKnowledge” qui est encore indisponible.
    http://www.trueknowledge.com/

  8. Commentaire de Joss — 13 mai 2008 @ 10:45

    Hmmmm!!Je préfère attendre qu’il tire ses résultats de plus de sources que Wikipédia et Freebase.

    On peut pas juger qu’une technologie soit bien juste parce que tout le monde est impatient de la voir en action.

    Pour l’instant c’est pas très satisfaisant tout ça et c’est loin des promesses de pertinence et de choix qu’on nous à présenté sur cette technologie, mais je lui donne le bénéfice du doute en attendant une amélioration des sources et résultats.

    En remarquant aussi que ce n’est que la premiere boite à ouvrir son moteur sémantique ;)

  9. Commentaire de Defaite — 13 mai 2008 @ 6:06

    Moi je pense qu’il faut lui laisser sa chance.

    @Sebastien Premierement, PowerSet n’a pas les mêmes ressources que Google, deuxiemement ton article date de 2001, soit 7 ans ! On l’a bien révolutionner le web depuis.

    Immaginons que plus tard, PowerSet nous permette d’améliorer son système en ajoutant nous même ce qu’on aurait voulu trouver, il se peut que ce système devienne vraiment puissant.

  10. Ping de Screencast #5: Powerset, la guerre des moteurs — 19 mai 2008 @ 12:46

    [...] Cela fait quelques temps que Powerset est sorti de sa beta privée, mais il n’est jamais trop tard pour jeter un oeil à ce joli [...]

  11. Commentaire de Nicolas Cynober — 19 mai 2008 @ 1:27

    En effet Powerset n’a pas les mêmes ressources que Google mais comme je le dis dans ce screencast et dans les commentaires qui s’en suivent, Powerset a décidé de développer son architecture de datacenter sur un mode opensource. L’objectif de Powerset est très clairement le “search” à grande échelle.
    L’équipe a l’air solide, on sait jamais … ;)

  12. Ping de TechCrunch en français » Microsoft sur le point de racheter Powerset? — 27 juin 2008 @ 7:37

    [...] avait été lancé à Techcrunch 40 l’année dernière et avait propose une première démonstration de sa technologie au public l’année [...]

  13. Ping de TechCrunch en français » [fr] Confirmé, Microsoft rachète le moteur de recherche PowerSet — 1 juillet 2008 @ 9:32

    [...] autour des 100 millions de dollars. Powerset avait récemment lancé une version de son moteur de recherche pour Wikipedia, à l’interface étonnante mais aux résultats pas si [...]

  14. Ping de Microsoft s’offre un nouveau moteur de recherche sémantique: Powerset | VT-DESIGN Le Blog — 2 juillet 2008 @ 11:51

    [...] encyclopédie communautaire Wikipédia. Une présentation de celui ci à été faite par le blog TechCrunch lors de la journée officielle de présentation de Powerset. Voilà une affaire à suivre dans la [...]

  15. Commentaire de Fifi — 13 juillet 2008 @ 7:48

    bonjour à tous,
    il me semble que le jour ou a ete présenté le 1er calculateur électronique,peu de gens à l’époque devaient se douter de ce qui pouvait etre fait pour l’ameliorer pour qu’il soit comme aujourd’hui, environ 60 ans aprés non?

  16. Ping de LSDI : Il giornalista del futuro? Un aggregatore umano — 1 août 2008 @ 8:07

    [...] Ci promettono un salto qualitativo con l’ arrivo dei motori di ricerca semantica, che saranno capaci di analizzare il contenuto che essi indicizzano, e non si limiteranno più soltanto a produrre dei link. Ma questa tecnologia è ancora solo ai  primi balbettii… [...]

Fil RSS pour les commentaires sur ce post. TrackBack URI

Laisser un commentaire

« Back to text comment