Skip to content

Commit ee805e9

Browse files
authored
fix build error from duplicate bibkeys (#3715)
also, fix python warning from string escapes * Benjamin Van Durme
1 parent bc3dada commit ee805e9

File tree

3 files changed

+4
-5
lines changed

3 files changed

+4
-5
lines changed

bin/anthology/latexcodec.py

Lines changed: 3 additions & 3 deletions
Original file line numberDiff line numberDiff line change
@@ -8,7 +8,7 @@
88
# PSF (Python Software Foundation) license found here:
99
# http://www.python.org/psf/license/
1010

11-
'''Translates unicode to bibtex-friendly encoding.
11+
r"""Translates unicode to bibtex-friendly encoding.
1212
1313
bibtex-friendly features:
1414
@@ -54,7 +54,7 @@
5454
5555
D. Eppstein, October 2003.
5656
57-
'''
57+
"""
5858

5959
from __future__ import generators
6060
import codecs
@@ -548,7 +548,7 @@ def candidates(self, offset):
548548
_blacklist.add(None) # shortcut candidate generation at end of data
549549

550550
# Construction of inverse translation table
551-
_l2u = {'\ ': ord(" ")} # unexpanding space makes no sense in non-TeX contexts
551+
_l2u = {'\\ ': ord(" ")} # unexpanding space makes no sense in non-TeX contexts
552552

553553
for _tex in latex_equivalents:
554554
if _tex <= 0x0020 or (_tex <= 0x007F and len(latex_equivalents[_tex]) <= 1):

data/xml/2024.jeptalnrecital.xml

Lines changed: 0 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -342,7 +342,6 @@
342342
<pages>271–280</pages>
343343
<abstract>L’arrivée de l’apprentissage auto-supervisé dans le domaine du traitement automatique de la parole a permis l’utilisation de grands corpus non étiquetés pour obtenir des modèles pré-appris utilisés comme encodeurs des signaux de parole pour de nombreuses tâches. Toutefois, l’application de ces méthodes de SSL sur des langues telles que le français s’est montrée difficile due à la quantité limitée de corpus de parole du français publiquement accessible. C’est dans cet objectif que nous présentons le corpus Audiocite.net comprenant 6682 heures d’enregistrements de lecture par 130 locuteurs et locutrices. Ce corpus est construit à partir de livres audio provenant du site audiocite.net. En plus de décrire le processus de création et les statistiques obtenues, nous montrons également l’impact de ce corpus sur les modèles du projet LeBenchmark dans leurs versions 14k pour des tâches de traitement automatique de la parole.</abstract>
344344
<url hash="7cc00cc2">2024.jeptalnrecital-jep.28</url>
345-
<language>fra</language>
346345
<bibkey>felice-etal-2024-audiocite-arrivee</bibkey>
347346
</paper>
348347
<paper id="29">

data/xml/2024.tacl.xml

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -94,7 +94,7 @@
9494
<title>Addressing the Binning Problem in Calibration Assessment through Scalar Annotations</title>
9595
<author><first>Zhengping</first><last>Jiang</last></author>
9696
<author><first>Anqi</first><last>Liu</last></author>
97-
<author><first>Benjamnin Van</first><last>Durme</last></author>
97+
<author><first>Benjamin</first><last>Van Durme</last></author>
9898
<doi>10.1162/tacl_a_00636</doi>
9999
<abstract>Computational linguistics models commonly target the prediction of discrete—categorical—labels. When assessing how well-calibrated these model predictions are, popular evaluation schemes require practitioners to manually determine a binning scheme: grouping labels into bins to approximate true label posterior. The problem is that these metrics are sensitive to binning decisions. We consider two solutions to the binning problem that apply at the stage of data annotation: collecting either distributed (redundant) labels or direct scalar value assignment. In this paper, we show that although both approaches address the binning problem by evaluating instance-level calibration, direct scalar assignment is significantly more cost-effective. We provide theoretical analysis and empirical evidence to support our proposal for dataset creators to adopt scalar annotation protocols to enable a higher-quality assessment of model calibration.</abstract>
100100
<pages>120–136</pages>

0 commit comments

Comments
 (0)