Souvent sur le blog on aborde les différents logiciels d’IA, de deep learning, de big data, les algorithmes, etc. pour enseigner à un ordinateur (ou un robot) comment conduire, reconnaitre un objet, etc.
Aujourd’hui, on a va se pencher sur la question: comment l’alimenter ? Internet, c’est bien, mais c’est vaste et il faut « miner » – c’est long, faut filtrer l’information, etc. Il y a une approche « intermédiaire » qui permet déjà de donner un tas d’informations à traiter à votre petit monstre: les bases de données. Et la bonne nouvelle, c’est qu’on a accès à des tas de bases de données en plus ou moins « open data » et qu’il vous manque juste un gros disque dur et une bonne connexion à internet pour charger tout ça !
Edit au 06/10/2016: A l’époque de l’article, j’avais listé ici les bases de données en Open Data, mais comme c’est une liste en constante évolution que je compte alimenter au fur et à mesure de mes découvertes, vous les trouverez sur cette page. N’hésitez pas me soumettre de nouveaux liens et à bookmarker cette page.
Avec ça, vous avez déjà de quoi faire votre propre watson (en attendant, amusez vous avec Deep Dive et ses propres Dataset):
https://www.youtube.com/watch?v=lI-M7O_bRNg
0 commentaires