Skip to content

Latest commit

 

History

History
91 lines (59 loc) · 3.02 KB

20171123_SGCIB_meetup-Elastic.adoc

File metadata and controls

91 lines (59 loc) · 3.02 KB

MeetUp #28 Elastic

Présenté à la SGCIB, dans le cadre des BBLs, par Dan Shaw (@dshaw) et David Mark Clements (@davidmarkclem).

20171123 meetup48 Elastic

Abstract

  • 19h05 : mot d’accueil par Cyrille DUPUYDAUBY, Head of Technical Architecture for ITEC/MKT

  • 19h15 : "Migration d’un cluster de 130 TB d’Elasticsearch 2 à 5 sans coupure" par Fred de VILLAMIL, Big Data Infrastructure & Engineering Leader chez Synthesio

  • 19h50 : "Un plugin qui écoute pour mieux comprendre", par Harold CAPITAINE, Tech Lead chez Ippon Technologies

  • 20h25 : Networking, food & drink

Overview

Sortie de la version 6.0 d’Elastic !

Migration d’un cluster de 130 TB d’Elasticsearch 2 à 5 sans coupure

ES @ Synthesio :

20171123 meetup48 Elastic 2

Infrastructure en Bare Metal (server Black Hole) et RAID 0.

Working units en Go qui vont lire dans Kafka

Elasticsearch 6 : très bonne fonctionnalité de sliced scrolls

Pour le passage de BlackHole 01 à BlackHole 02 : utilisation de Ansible.

Donc actuellement, on a un cluster ES 5 qui stocke des index ES 2 → cela rend le passage en ES 6 impossible.

Pourquoi le passage à ES 5 ?

  • utilisation de features plus avancées : sliced scrolls

Une présentation pour les utilisateurs avancés d’ES

Ressources

  • Le blog de Fred (sur ES bien sûr !) est apparemment très sympa

Un plugin qui écoute pour mieux comprendre

Plutôt qu’une bonne saisie / qualité de data (par la caissière), il faut être capable de retrouver rapidement son client.

Il s’agit ici de reconnaissance vocale, ou, plus spécifiquement, de reconnaissance phonétique (le but n’étant pas d’obtenir l’orthographe exacte du nom du client, MAIS de retrouver ce dernier)

Donc, pour les plugins essayés :

  • Soundex / RefinedSoundex : langue anglaise uniquement

  • Metaphone / Double metaphone

  • Beider Morse : puissant dans ses possibilités, mais pb de perf (38 opération / sec contre 16 000 pour soundex ???)

Rien de satisfaisant, donc, création de son propre plugin :

  • lit de gauche à droite

  • ne revient pas en arrière

  • xxx

Utilisation des token streams d’ES pour la gestion de multi-tokens pour un même mot.

Pas de problème pour faire fonctionner le plugin de la version 2.4 à 6 d’Elasticsearch.

Ressources