Fix bug i hent_punkt #721

krebslw · 2023-10-26T08:03:10Z

Resolves #720

kbevers

Jeg er ret sikker på at løsningen her fungerer, men jeg lurer på om ikke det er smartere at løse problemet i hent_punkter()? Altså, sådan at hvis der er et eksakt match på identen vil det altid være det første i den returnerede liste. Med lidt snilde kan man få databasen til at gøre det. Her er et simpelt eksempel:

SELECT * FROM punktinfo pi 
WHERE pi.infotypeid=347 AND pi.tekst LIKE '%SAND%' 
ORDER BY LENGTH(pi.tekst);

Med andre ord, det korteste ident-match kommer først i listen. Det kræver at der tilføjes noget i stil med order_by(PunktInformation.tekst.length) til SQLAlchemy opslaget i hent_punkter().

Uanset om den ene eller anden tilgang bruges vil det være godt at få tilføjet en test til test-suiten, så vi er sikre på at den ny funktionalitet virker efter hensigten. Det kræver formentligt at der tilføjes et ny ident i test/sql/testdata.sql. Man kan fx tilføje et GL RDO1 til et af punkterne i testdatasættet. Kig omkring linje 300 i filen.

krebslw · 2023-10-26T15:12:14Z

Ja havde godt tænkt at det skulle testes.
Og tror også dit foreslag vil virke fint. Synes det tilføjer noget "implicit" logik da man så antager at det korteste navn er det rigtige. Alternativt kan man sortere således:

SELECT * FROM punktinfo pi 
WHERE pi.infotypeid=347 AND pi.tekst LIKE '%SAND%' 
ORDER BY (CASE WHEN pi.tekst='SAND' THEN 1 ELSE 2 END);

hvis det altså kan lade sig gøre sqlalchemy-style (har lige tjekket at det virker med oracle.)

Det leder også til spørgsmålet om hvilken løsning der er hurtigst, jf. issue #422, skulle vi ikke gøre det unødigt langsomt.

kbevers · 2023-10-26T18:41:47Z

Synes det tilføjer noget "implicit" logik da man så antager at det korteste navn er det rigtige.

Vi laver følgende opslag

FIRE/fire/api/firedb/hent.py

Lines 91 to 109 in 619af08

    
           result = ( 
        
               self.session.query(Punkt) 
        
               .options( 
        
                   joinedload(Punkt.geometriobjekter), 
        
                   joinedload(Punkt.koordinater), 
        
               ) 
        
               .join(PunktInformation) 
        
               .join(PunktInformationType) 
        
               .filter( 
        
                   PunktInformationType.name.startswith("IDENT:"), 
        
                   PunktInformation._registreringtil == None,  # NOQA 
        
                   or_( 
        
                       PunktInformation.tekst == ident, 
        
                       PunktInformation.tekst == f"FO  {ident}", 
        
                       PunktInformation.tekst == f"GL  {ident}", 
        
                   ), 
        
                   Punkt._registreringtil == None,  # NOQA 
        
               ) 
        
               .all()

hvor der matches på tre ting: ident, FO {ident} og GL {ident}. Det skulle meget gerne resultere i at det korteste er det eksakte match. Hvis indholdet af ident har et FO- eller GL-præfix kan det kun matche på den første. Så skulle man ende i den uheldige situation at man leder efter FO SAND, så kan man skrive det eksplicit og med sikkerhed fremfinde det.

Det leder også til spørgsmålet om hvilken løsning der er hurtigst, jf. issue #422, skulle vi ikke gøre det unødigt langsomt.

Det der er dyrt i hent_punkt og venner, er at lave mappingen mellem pythonobjekter og SQL-udtryk. Altså alle de joins der skal laves på kryds og tværs for at udfylde alle felter i Punkt. Jeg tror ikke en sortering på databasesiden koster noget nævneværdigt i den sammenhæng, men det skal times for at kunne afgøres med sikkerhed. Det er i hvert fald ikke noget jeg er synderligt bekymret for og jeg regner med en performance forbedring når vi skifter til SQLAlchemy 2.0 som tager hånd om en del af den sløvhed vi ser nu.

Test af ændring tilføjet i 1f0be10.

kbevers · 2023-12-14T09:40:26Z

@krebslw Som du kan se har jeg tilføjet en test og backportet til 1.6. Vi fik aldrig lejlighed til at lave testen sammen og nu har jeg lige brug for at dit fix kommer i spil. Brug gerne lidt tid på at læse mine tilføjelser igennem, så du har en ide om hvordan noget lignende kan gøres i fremtiden.

kbevers reviewed Oct 26, 2023

View reviewed changes

krebslw and others added 2 commits December 14, 2023 10:30

Fix bug i hent_punkt

3354435

Tilføj test af håndtering af identdupletter med landekode

8ee5883

Test af ændring tilføjet i 1f0be10.

kbevers force-pushed the bugfix branch from 1f0be10 to 8ee5883 Compare December 14, 2023 09:31

kbevers merged commit e829f14 into SDFIdk:master Dec 14, 2023

kbevers added the backport 1.6 label Dec 14, 2023

github-actions bot mentioned this pull request Dec 14, 2023

[Backport 1.6] Fix bug i hent_punkt #728

Merged

krebslw deleted the bugfix branch August 15, 2024 09:16

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Fix bug i hent_punkt #721

Fix bug i hent_punkt #721

krebslw commented Oct 26, 2023

kbevers left a comment

krebslw commented Oct 26, 2023

kbevers commented Oct 26, 2023

kbevers commented Dec 14, 2023

Fix bug i hent_punkt #721

Fix bug i hent_punkt #721

Conversation

krebslw commented Oct 26, 2023

kbevers left a comment

Choose a reason for hiding this comment

krebslw commented Oct 26, 2023

kbevers commented Oct 26, 2023

kbevers commented Dec 14, 2023