Skip to content

Commit

Permalink
add more church names
Browse files Browse the repository at this point in the history
  • Loading branch information
Xavier Medrano authored and Xavier Medrano committed Oct 25, 2024
1 parent 4f49be9 commit ce140ee
Show file tree
Hide file tree
Showing 2 changed files with 13 additions and 15 deletions.
26 changes: 12 additions & 14 deletions name_data/labeled/company_labeled.xml
Original file line number Diff line number Diff line change
Expand Up @@ -29,8 +29,7 @@
<Name><CorporationName>area</CorporationName> <CorporationName>property</CorporationName> <CorporationName>service</CorporationName></Name>
<Name><CorporationName>seiu</CorporationName> <CorporationCommitteeType>political</CorporationCommitteeType> <CorporationCommitteeType>fund</CorporationCommitteeType></Name>
<Name><CorporationName>gp</CorporationName> <CorporationNameOrganization>corp</CorporationNameOrganization></Name>
<Name>
<ShortForm>bbc</ShortForm>
<Name><ShortForm>bbc</ShortForm>
</Name>
<Name><CorporationName>kaleo</CorporationName> <CorporationLegalType>inc</CorporationLegalType> <AKA>dba</AKA> <CorporationName>cleo's</CorporationName></Name>
<Name><CorporationName>motorola,</CorporationName> <CorporationLegalType>inc.</CorporationLegalType></Name>
Expand Down Expand Up @@ -66,8 +65,7 @@
<Name><CorporationName>american</CorporationName> <CorporationName>mobile</CorporationName> <CorporationName>staging</CorporationName> <CorporationLegalType>inc.</CorporationLegalType></Name>
<Name><CorporationName>stu's</CorporationName> <CorporationName>bargain</CorporationName> <CorporationName>outlet</CorporationName></Name>
<Name><CorporationName>nekritz</CorporationName> <CorporationName>for</CorporationName> <CorporationName>state</CorporationName> <CorporationName>representative</CorporationName></Name>
<Name>
<CorporationName>eve's</CorporationName>
<Name><CorporationName>eve's</CorporationName>
</Name>
<Name><CorporationName>united</CorporationName> <CorporationName>gasket</CorporationName> <CorporationNameOrganization>corporation</CorporationNameOrganization></Name>
<Name><CorporationName>petropoulos</CorporationName> <CorporationName>washer</CorporationName> <CorporationName>service</CorporationName></Name>
Expand Down Expand Up @@ -140,8 +138,7 @@
<Name><CorporationName>skyway</CorporationName> <CorporationName>elevator</CorporationName> <CorporationLegalType>inc</CorporationLegalType></Name>
<Name><CorporationName>hammond</CorporationName> <CorporationName>fence</CorporationName> <CorporationNameOrganization>co.</CorporationNameOrganization> <CorporationName>of</CorporationName> <CorporationName>indiana</CorporationName> <CorporationLegalType>inc.</CorporationLegalType></Name>
<Name><CorporationName>crain</CorporationName> <CorporationName>&amp;</CorporationName> <CorporationName>feed</CorporationName> <CorporationNameOrganization>legislative</CorporationNameOrganization> <CorporationNameOrganization>council</CorporationNameOrganization></Name>
<Name>
<CorporationName>restaurant.com</CorporationName>
<Name><CorporationName>restaurant.com</CorporationName>
</Name>
<Name><CorporationName>op</CorporationName> <CorporationName>plstrs</CorporationName> <CorporationName>&amp;</CorporationName> <CorporationName>cmnt</CorporationName> <CorporationName>mason</CorporationName> <CorporationNameBranchType>local</CorporationNameBranchType> <CorporationNameBranchIdentifier>#18</CorporationNameBranchIdentifier></Name>
<Name><CorporationName>u</CorporationName> <CorporationName>s</CorporationName> <CorporationName>paving</CorporationName></Name>
Expand Down Expand Up @@ -252,8 +249,7 @@
<Name><CorporationName>state</CorporationName> <CorporationName>of</CorporationName> <CorporationName>illinois</CorporationName> <CorporationName>fraternal</CorporationName> <CorporationName>order</CorporationName> <CorporationName>of</CorporationName> <CorporationName>police</CorporationName> <CorporationNameBranchType>lodge</CorporationNameBranchType> <CorporationNameBranchIdentifier>72</CorporationNameBranchIdentifier></Name>
<Name><CorporationName>mangieri</CorporationName> <CorporationName>electric</CorporationName></Name>
<Name><CorporationName>billy</CorporationName> <CorporationName>goat</CorporationName> <CorporationName>north</CorporationName> <CorporationNameBranchIdentifier>ii</CorporationNameBranchIdentifier> <CorporationLegalType>inc.</CorporationLegalType></Name>
<Name>
<ShortForm>cfem</ShortForm>
<Name><ShortForm>cfem</ShortForm>
</Name>
<Name><CorporationName>abc</CorporationName> <CorporationName>auto</CorporationName></Name>
<Name><CorporationName>eclipse</CorporationName>
Expand Down Expand Up @@ -284,8 +280,7 @@
<Name><CorporationName>marian</CorporationName> <CorporationName>realty</CorporationName></Name>
<Name><CorporationName>napleton</CorporationName> <CorporationName>honda</CorporationName></Name>
<Name><CorporationName>napoli</CorporationName> <CorporationName>pizza</CorporationName></Name>
<Name>
<CorporationName>smitherine</CorporationName>
<Name><CorporationName>smitherine</CorporationName>
</Name>
<Name><CorporationName>beecken</CorporationName> <CorporationName>petty</CorporationName> <CorporationName>o'keefe</CorporationName> <CorporationNameAndCompany>&amp;</CorporationNameAndCompany> <CorporationNameAndCompany>company</CorporationNameAndCompany> <CorporationLegalType>llc</CorporationLegalType></Name>
<Name><CorporationName>sociedad</CorporationName> <CorporationName>civica</CorporationName> <CorporationName>cultural</CorporationName> <CorporationName>centroamericana</CorporationName></Name>
Expand Down Expand Up @@ -726,8 +721,7 @@
<Name><CorporationName>New</CorporationName> <CorporationName>Image</CorporationName> <CorporationName>Dentistry</CorporationName></Name>
<Name><CorporationName>Atkinson</CorporationName> <CorporationName>Family</CorporationName> <CorporationName>Dentistry</CorporationName></Name>
<Name><CorporationName>Kids</CorporationName> <CorporationName>Teeth</CorporationName></Name>
<Name>
<CorporationName>PreZenDental</CorporationName>
<Name><CorporationName>PreZenDental</CorporationName>
</Name>
<Name><CorporationName>ALEX</CorporationName> <CorporationName>DISPLAYS</CorporationName> <CorporationNameAndCompany>&amp;</CorporationNameAndCompany> <CorporationNameAndCompany>CO</CorporationNameAndCompany> <CorporationLegalType>INC</CorporationLegalType></Name>
<Name><CorporationName>swidler</CorporationName> <CorporationName>spanola</CorporationName> <CorporationNameAndCompany>&amp;</CorporationNameAndCompany> <CorporationNameAndCompany>co,</CorporationNameAndCompany> <CorporationLegalType>llc</CorporationLegalType></Name>
Expand Down Expand Up @@ -1471,8 +1465,7 @@
<Name><CorporationName>Hope</CorporationName> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
<Name><CorporationName>Congregation</CorporationName> <CorporationName>Adath</CorporationName> <CorporationName>Jeshurun</CorporationName></Name>
<Name><CorporationName>Central</CorporationName> <CorporationNameOrganization>Methodist</CorporationNameOrganization> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
<Name>
<CorporationName>HerChurch</CorporationName>
<Name><CorporationName>HerChurch</CorporationName>
</Name>
<Name><CorporationName>Wyco</CorporationName> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
<Name><CorporationNameOrganization>Methodist</CorporationNameOrganization> <CorporationNameOrganization>Church</CorporationNameOrganization> <CorporationName>Concord</CorporationName></Name>
Expand All @@ -1492,4 +1485,9 @@
<Name><CorporationName>Ben</CorporationName> <CorporationName>Hill</CorporationName> <CorporationName>United</CorporationName> <CorporationNameOrganization>Methodist</CorporationNameOrganization> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
<Name><CorporationName>Mount</CorporationName> <CorporationName>Hope</CorporationName> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
<Name><CorporationName>Vineyard</CorporationName> <CorporationNameOrganization>Church</CorporationNameOrganization> <CorporationName>of</CorporationName> <CorporationName>Ann</CorporationName> <CorporationName>Arbor</CorporationName></Name>
<Name><CorporationName>Christ</CorporationName> <CorporationNameOrganization>Episcopal</CorporationNameOrganization> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
<Name><CorporationName>Elizabeth</CorporationName> <CorporationNameOrganization>Baptist</CorporationNameOrganization> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
<Name><CorporationName>Sacred</CorporationName> <CorporationName>Heart</CorporationName> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
<Name><CorporationName>St.</CorporationName> <CorporationName>Mark</CorporationName> <CorporationNameOrganization>Lutheran</CorporationNameOrganization> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
<Name><CorporationName>Holy</CorporationName> <CorporationName>Rosary</CorporationName> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
</NameCollection>
2 changes: 1 addition & 1 deletion tests/test_tagging.py
Original file line number Diff line number Diff line change
Expand Up @@ -19,7 +19,7 @@ def test_basic():
"name_text,components",
readTrainingData(["tests/test_data_labeled.xml"], GROUP_LABEL),
)
def test_simple_addresses(name_text, components):
def test_names(name_text, components):

_, labels_true = list(zip(*components))
_, labels_pred = list(zip(*parse(name_text)))
Expand Down

0 comments on commit ce140ee

Please sign in to comment.