이제 제목별로 단어를 분류하고 있는데 각 제목에는 3개의 단어가 있습니다
분리된 단어를 저장하기 위해 별도의 태그 테이블을 만들었고, 각 단어에 대한 레코드가 하나씩 있습니다. 관련 기사를 읽을 때 무작위로 태그를 읽은 다음 검색합니다. 같은 태그에 대한 태그 테이블, 예전에는 데이터가 거의 없었을 때는 괜찮았는데, 지금은 태그 테이블에 1억 개가 넘는 데이터가 있고, 태그 테이블에 필드가 2개밖에 없어서 읽기가 엄청 느립니다. , 기사 ID 및 단어 분할이 모두 색인화되어 분할됩니다.
관련 글을 쓰는 다른 방법이 있나요?
이제 매일 5W+++가 추가됩니다
淡淡烟草味2017-05-18 10:53:12
관련성 측정에는 여러 차원이 있어야 합니다.
1, 기사가 속한 섹션(예: 엔터테인먼트)
2, 기사의 중심 아이디어나 주제가 무엇인지, 추출
3, 시간은 주요 객체(캐릭터, 이벤트)와 연관됩니다
기사에는 여러 주제 개체가 있을 수 있으며 여러 섹션에 걸쳐 관련될 수 있습니다