Is ChatGPT Good at Search? (emnlp 2023)

참고자료: Weiwei Sun et al., Is ChatGPT Good at Search? Investigating Large Language Models as Re-Ranking Agents, emnlp2023 논문에서 제안하는 방법으로 chatgpt, gpt-4로 랭킹했을 때의 검색 성능 GPT-4가 가장 좋고, monoT5가 다음으로 좋음. GPT-4는 튜닝없이, prompt만으로 랭킹. monoT5는 T5를 랭킹에 맞게 fine-tuning 한 모델 모델 크기는 GPT-4가 monoT5보다 훨씬 큼. instructional permutation generation (그림 2에서 c) chatgpt 혹은 gpt-4와 같은 LLM으로 랭킹하는 하는 새로운 방법 질의와 하나 이상의 문서를 입력으로 받아서, 문서들의 순서 정하도록 LLM에게 요청함 1차 검색된 상위 n개 문서들을 대상으로 LLM으로 re-ranking 수행함 Sliding Window Strategy (그림 3) 1차 검색된 상위 n개 문서들에 대해서 가장 낮은 w개의 문서들부터 시작 w개의 문서들을 LLM으로 순위화 window를 앞으로 이동해서, 동일한 방식으로 순위화 진행 window 이동시에는 이전 윈도우와 일부 겹치도록 함. (그림 3의 step 2 참조) 참고로 기존 방법은 다음과 같음 query generation 방식: 질의와 문서가 주어졌을 때, 문서로부터 질의가 생성될 확률 계산 (그림2에서 a) relevance generation 방식: 질의와 문서가 주어졌을 때, 적합여부를 판단하도록 함. (그림 2에서 b) 다만, 적합 여부 판단만으로는 랭킹이 안되는데, 뭔가 추가적인 것이 더 있을 듯. permutation distillation chatgpt을 teacher로 사...