Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Fix portal article's non-display span #435

Open
ddungiii opened this issue Jan 9, 2024 · 6 comments
Open

Fix portal article's non-display span #435

ddungiii opened this issue Jan 9, 2024 · 6 comments
Assignees
Labels
bug Something isn't working

Comments

@ddungiii
Copy link
Member

ddungiii commented Jan 9, 2024

포탈 공지글 원문의 workerRunId, requestId 이 노출되는 것을 수정한다.
https://newara.sparcs.org/post/249226?from_view=board&current=11&from_page=11

Screenshot 2024-01-09 at 10 52 38 PM Screenshot 2024-01-09 at 10 55 48 PM
@ddungiii ddungiii added the bug Something isn't working label Jan 9, 2024
@ddungiii ddungiii self-assigned this Jan 9, 2024
@ddungiii
Copy link
Member Author

https://newara.sparcs.org/user/90798

위 유저가 작성한 포탈게시글은 대부분 노출중

@ddungiii
Copy link
Member Author

1/31
지금까지 파악한 걸론 nbsp parsing 하면서 문제가 생기는 걸로 보임
workerRunId 뿐만 아니라 다른 text들 띄워쓰기도 문제가 있어서 nbsp로 해결 가능할지도?

@hyeongukryu
Copy link

hyeongukryu commented Feb 2, 2024

  • 모든 KAIST 구성원을 위한 편리한 서비스를 제공해 주셔서 항상 감사드립니다.
  • 저희가 글을 게시하는 방식이 Ara에서 표시되는 모습에 영향을 주는 것을 발견하여, 관련 정보 조사 중 이슈를 발견하였습니다.
  • 의도치 않게 이슈 발생에 기여하게 된 점 죄송하며, 해결하시는 데 도움이 될 만한 정보를 드리고자 합니다. 😃

메타데이터

  • 자동화 도구로 작성한 글을 식별하고 성공 여부 등을 추적하기 위하여, 시작 부분에 아래와 같은 모습의 메타데이터를 추가하고 있습니다.
<span id="kaist-gsa-kaist-board-writer-metadata-version-${UUID}" style="display: none;">내용</span>
  • 내부 내용은 변동될 수 있으나, <span> 요소와 style="display: none;"으로 구성된다는 점은 항상 똑같고, 변경 계획이 없습니다.
  • UUID는 현재 103ad5dd-8619-4694-9d50-747c61c46074이며, 드물게 변경될 수 있습니다. UUID 부분은 항상 올바른 UUID 문자열 표현(8-4-4-4-12)입니다.
  • UUID 변경 가능성에도 불구하고, id가 kaist-gsa-kaist-board-writer-metadata-version-로 시작한다는 것은 항상 만족하며, 변경 계획이 없습니다.

개인 정보 패턴 탐지 우회

  • 개인 정보에 해당하지 않지만 본문이 개인 정보 텍스트를 포함하는 것으로 잘못 인식되어 글 작성에 실패하는 경우가 빈번히 발생하여, 개인 정보 패턴 탐지를 우회하는 처리를 하고 있습니다.
  • 항상 아래 내용을 삽입합니다. 과거에는 문제가 되는 부분에만 처리하였으나, 얼마 전부터는 모든 글의 모든 텍스트에 적용하고 있습니다.
<span style="display: none;">&nbsp;</span>

@ddungiii
Copy link
Member Author

@hyeongukryu 안녕하세요, 뉴아라 백엔드 개발자 김기영입니다.

직접 이슈까지 찾아와주셔서 정말 감사합니다! 전달해주신 정보가 문제를 해결하는데 큰 도움이 될 것 같습니다. 도움을 바탕으로 잘 해결해보겠습니다. 👍

@ddungiii
Copy link
Member Author

original HTML (안녕하세요, 제51대 KAIST 대학원 총학생회입니다.)
</span>하<span style="display: none;">&nbsp;</span>세<span style="display: none;">&nbsp;</span>요<span style="display: none;">&nbsp;</span>,<span style="display: none;">&nbsp;</span> <span style="display: none;">&nbsp;</span>제<span style="display: none;">&nbsp;</span>5<span style="display: none;">&nbsp;</span>1<span style="display: none;">&nbsp;</span>대<span style="display: none;">&nbsp;</span> <span style="display: none;">&nbsp;</span>K<span style="display: none;">&nbsp;</span>A<span style="display: none;">&nbsp;</span>I<span style="display: none;">&nbsp;</span>S<span style="display: none;">&nbsp;</span>T<span style="display: none;">&nbsp;</span> <span style="display: none;">&nbsp;</span>대<span style="display: none;">&nbsp;</span>학<span style="display: none;">&nbsp;</span>원<span style="display: none;">&nbsp;</span> <span style="display: none;">&nbsp;</span>총<span style="display: none;">&nbsp;</span>학<span style="display: none;">&nbsp;</span>생<span style="display: none;">&nbsp;</span>회<span style="display: none;">&nbsp;</span>입<span style="display: none;">&nbsp;</span>니<span style="display: none;">&nbsp;</span>다<span style="display: none;">&nbsp;</span>.</div>

@ddungiii
Copy link
Member Author

ddungiii commented Feb 13, 2024

prettified HTML (안 녕 하 세 요 , 제 5 1 대 K A I S T 대 학 원 총 학 생 회 입 니 다 .)
<div> 안 <span style="display: none;"> </span> 녕 <span style="display: none;"> </span> 하 <span style="display: none;"> </span> 세 <span style="display: none;"> </span> 요 <span style="display: none;"> </span> , <span style="display: none;"> </span> <span style="display: none;"> </span> 제 <span style="display: none;"> </span> 5 <span style="display: none;"> </span> 1 <span style="display: none;"> </span> 대 <span style="display: none;"> </span> <span style="display: none;"> </span> K <span style="display: none;"> </span> A <span style="display: none;"> </span> I <span style="display: none;"> </span> S <span style="display: none;"> </span> T <span style="display: none;"> </span> <span style="display: none;"> </span> 대 <span style="display: none;"> </span> 학 <span style="display: none;"> </span> 원 <span style="display: none;"> </span> <span style="display: none;"> </span> 총 <span style="display: none;"> </span> 학 <span style="display: none;"> </span> 생 <span style="display: none;"> </span> 회 <span style="display: none;"> </span> 입 <span style="display: none;"> </span> 니 <span style="display: none;"> </span> 다 <span style="display: none;"> </span> . </div>

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working
Projects
None yet
Development

No branches or pull requests

2 participants