YaCy: un moteur de recherche OpenSource évitant la censure !

Il s’ag­it d’un moteur de recherche Open Source et surtout, Peer to Peer (P2P). YaCy, con­traire­ment à Google, Yahoo et autres n’est donc pas soumis à la cen­sure.  C’est à dire, qu’il n’est pas sous l’au­torité d’une société privée ou d’un pays.

Présentation

Une instance de YaCy partage ain­si son index avec d’autres pairs, cela lui per­met aus­si de résis­ter à la sup­pres­sion de fichiers. Vos recherch­es sont effec­tuées sur votre instance YaCy et ne sont donc com­mu­niquées à per­son­ne.

Vous pou­vez le con­fig­ur­er de plusieurs façons:

  • en peer to peer (partage des por­tions de web avec les autres)
  • en autonome pour choisir les por­tions de web (à vous de les définir)
  • en local pour utilis­er des pages web stock­ées locale­ment (en choi­sis­sant les réper­toires)
  • inté­gra­tion de l’API d’une fenêtre de recherche dans un site Web ou wid­get de recherche

YaCy se décom­pose en 4 mod­ules : un web crawler, un moteur d’indexation, une base de don­nées et une inter­face util­isa­teur. Il est pos­si­ble de rechercher: du texte,des images,des vidéos et des appli­ca­tions.

Pour une recherche lim­itée sur un site par­ti­c­uli­er, il suf­fit d’indi­quer:  “mot site:le_site.com”, mot étant le mot à rechercher sur le site en ques­tion.

Les résul­tats sont très dif­férents de ceux de google, pas for­cé­ment meilleurs, il peut donc être un com­plé­ment de recherche.

YaCy com­prend des com­posants utiles à la mise en réseau, à l’ad­min­is­tra­tion, à la main­te­nance de l’indice avec une ges­tion des listes noires (black-lists), à la mod­éra­tion de la com­mu­nauté… La fig­ure suiv­ante mon­tre les dif­férents com­posants de YaCy:

Yacy com­mu­nique sur sa philoso­phie sur la société actuelle et l’ac­cès à l’in­for­ma­tion. En résumé ils met­tent l’ac­cent sur: le respect des droits indi­vidu­els et de la vie privée,l’écologie du fait du non besoin de data-cen­ters etl’é­gal­ité: tous les indi­vidus ont les mêmes droits.

Installation

Voici une série de vidéo pour vous aider à met­tre en place cet out­il:

Il faut télécharg­er le logi­ciel et l’in­staller l’ap­pli sur son poste pour pou­voir l’u­tilis­er. Elle existe en ver­sion Win­dows, Lin­ux et Mac Os.

Il vous donne la pos­si­bil­ité d’exécuter votre por­tail de recherche sur votre poste en local ou sur un serveur dédié.

Par défaut, à l’in­stal­la­tion, c’est le mode intranet qui est activé. Cela sig­ni­fie que l’ap­pli­ca­tion va scan­ner tous vos dossiers et index­er les doc­u­ments. C’est bien enten­du paramé­tra­ble et vous pou­vez aus­si pass­er en mode web.

L’op­tion du milieu est tout aus­si intéres­sante: vous pou­vez pré­cis­er quelques por­tails et faire en sorte que le sys­tème indexe de lui-même toutes les pages de ces derniers. Ain­si, la recherche n’est pas pol­luée par d’autres résul­tats.

Et évidem­ment, la pre­mière option con­siste à partager avec les autres ses con­tenus indexés !  (pas en local bien sûr). Imag­inez: vous avez un blog et vous souhaitez aug­menter ses vis­ites — il suf­fit de l’in­dex­er et de partager ! Bon, l’idée prin­ci­pale c’est quand même d’échap­per à la cen­sure !  (en terme de moteur de recherche, car si on vous sup­prime votre nom de domaine, y‑a plus qu’à pleur­er ou aller sur le dark­net).

Peu importe le choix, on peut ajouter un bal­ayage de site en util­isant le menu “charg­er des pages web, bal­ayeur”. Ce qui est top, c’est que si je prend l’ex­em­ple de mon blog, je peux faire en sorte d’in­dex­er tous les liens relat­ifs à ce dernier, c’est à dire tous les arti­cles et autres sites qui m’ont intéressés ! Regardez ce joli index en cours de créa­tion et que je vais partager avec tout le monde (cliquez pour agrandir):

Voir le proces­sus en cours d’in­dex­a­tion (chez moi):

La cap­ture ci-dessous cor­re­spond à une recherche “Unre­al Engine” sur mon pro­pre nœud car “mode fur­tif” est activé. Si je clique sur “Pair à Pair”, alors j’u­tilise les nœuds externes du P2P:

Donc, si vous avez une tonne de livres en PDF, des doc­u­ments dans tous les sens, et des sites préférés bour­rés d’in­fos utiles, ce moteur est aus­si fait pour vous ! Vous pour­riez même met­tre en place un petit serveur Rasp­ber­ry PI qui s’oc­cupe de tout et que vous pou­vez accéder de n’im­porte où. C’est votre moteur de recherche  ! Et plus si affinité.

Le coté API m’at­tire bien aus­si. Comme je bosse sur Machine Learn­ing en ce moment, cela pour­rait être une aide pré­cieuse pour mes tests.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.