빔 서치(Beam Search)는 디코더가 여러 개의 후보 토큰 시퀀스를 유지하면서 최적의 시퀀스를 선택하는 기법입니다. 이를 통해 단순히 최대 확률을 갖는 단어 하나만 선택하는 대신, 여러 개의 후보를 고려하여 더 나은 텍스트를 생성할 수 있습니다. 아래는 빔 서치의 사용 방법을 간단히 설명한 것입니다: 빔 크기(Beam Size) 설정: 빔 서치에서는 각 타임 스텝마다 빔 크기라고 하는 후보 시퀀스의 개수를 설정합니다. 빔 크기가 클수록 더 많은 후보가 유지되므로 더 정확한 결과를 얻을 가능성이 높아집니다. 하지만 계산 비용도 증가하므로 적절한 빔 크기를 선택해야 합니다. 초기화: 빔 서치를 시작하기 위해 시작 토큰(예: "[CLS]")을 입력으로 사용하여 디코더를 초기화합니다. 이 시작 토큰을 통해..