저자: 첸링크: https://zhuanlan.zhihu.com/p/20634396소스: 알아저작권은 저자에 속한다. 상업적인 reprints 인증, 비-상업적 무단 전재를 얻을, 소스를 표시 하시기 바랍니다 작성자를 문의 하시기 바랍니다.-AlphaGo 그것을 어떻게?이 놀이의 독특한 기술을 어떻게 그 AlphaGo 당신은? 다음 행동을 하는 방법을 결정할 때 앞서 언급 한 프레임 워크, AlphaGo (및 많은 다른 체스 인공 지능), 유사한 MinMax 검색 MCTS (몬테카를로 트리 검색) 검색 프레임 워크를 사용 합니다.대략 비교 MinMax 알고리즘: MCTS, 효과적인 "잘라내기" 알고리즘 검색 공간의 크기를 제어 컴퓨터 시뮬레이션 리허설의 가능한 모든 루트에서 시작 하 여 루트 노드를 이동 하 고 이동, 차례 차례로, 마지막 단계로 계산의 결과 영향을 미치는 현재 노드 선택 하기 전에 주어진을 위한 알고리즘. 전통적인 체스 인공 지능 상대 게임 디자인 어려움 앞에서 언급 한: 너무 많이 이동 1) 수 있습니다 (즉, 더 큰 분기 요소) 정적의 게임 점수를 계산 하지 좋은 평가 기능 매우 큰 검색 공간에 2)입니다. 2 제안 된 솔루션에 대 한 MCTS: 검색 더 많은 공간을 우리가 걸릴 정리 알파-베타 가지 치기 전략 보다 더 급진적인, 유일한 휴가 제한 (나중에 선택, 확장 함) 가장 유망한 움직임에 컴퓨팅 리소스, 중간 게임 좋은 또는 나쁜 그것은 예측 하기 어려운, 우리 (시뮬레이션 나중에 언급) 최종 승자까지 시뮬레이션!MCTS 알고리즘은 반복 알고리즘, 각 반복 4 단계를 통해 이동 하는 것입니다: 선택, 확장, 시뮬레이션, 다시 전파. 현재 아래 다이어그램에서는 MCTS 검색 공간, 시간이 제한 된 자식 노드 (보다는 오히려 공간의 모든 가능성의 전체 검색) 검색 범위입니다.
번역되고, 잠시 기다려주십시오..
