Présenté à la SGCIB, dans le cadre des BBLs, par Dan Shaw (@dshaw) et David Mark Clements (@davidmarkclem).
-
19h05 : mot d’accueil par Cyrille DUPUYDAUBY, Head of Technical Architecture for ITEC/MKT
-
19h15 : "Migration d’un cluster de 130 TB d’Elasticsearch 2 à 5 sans coupure" par Fred de VILLAMIL, Big Data Infrastructure & Engineering Leader chez Synthesio
-
19h50 : "Un plugin qui écoute pour mieux comprendre", par Harold CAPITAINE, Tech Lead chez Ippon Technologies
-
20h25 : Networking, food & drink
ES @ Synthesio :
Infrastructure en Bare Metal (server Black Hole) et RAID 0.
Working units en Go qui vont lire dans Kafka
Elasticsearch 6 : très bonne fonctionnalité de sliced scrolls
Pour le passage de BlackHole 01 à BlackHole 02 : utilisation de Ansible.
Donc actuellement, on a un cluster ES 5 qui stocke des index ES 2 → cela rend le passage en ES 6 impossible.
Pourquoi le passage à ES 5 ?
-
utilisation de features plus avancées : sliced scrolls
Une présentation pour les utilisateurs avancés d’ES
Plutôt qu’une bonne saisie / qualité de data (par la caissière), il faut être capable de retrouver rapidement son client.
Il s’agit ici de reconnaissance vocale, ou, plus spécifiquement, de reconnaissance phonétique (le but n’étant pas d’obtenir l’orthographe exacte du nom du client, MAIS de retrouver ce dernier)
Donc, pour les plugins essayés :
-
Soundex / RefinedSoundex : langue anglaise uniquement
-
Metaphone / Double metaphone
-
Beider Morse : puissant dans ses possibilités, mais pb de perf (38 opération / sec contre 16 000 pour soundex ???)
Rien de satisfaisant, donc, création de son propre plugin :
-
lit de gauche à droite
-
ne revient pas en arrière
-
xxx
Utilisation des token streams d’ES pour la gestion de multi-tokens pour un même mot.
Pas de problème pour faire fonctionner le plugin de la version 2.4 à 6 d’Elasticsearch.
-
GitHub : hcapitaine/french-phonetic-analyser - french phonetic filter