Представьте себе, что вы играете в шахматы против такой машины. Чтобы сделать ситуацию
справедливой, предположим, что вы играете заочно, не зная, что играете против машин, и,
следовательно, без предубеждений. Естественно, как всегда бывает в шахматной игре, вы составите
некоторое суждение о шахматной индивидуальности вашего противника. Вы обнаружите, что, когда на
доске возникает дважды одно и то же положение, ваш противник будет реагировать каждый раз
одинаковым образом, и вы решите, что его поведение весьма негибкое. Если какой-нибудь из ваших
приемов достигнет цели, то этот прием всегда будет достигать цели при тех же самых условиях.
Поэтому искусному игроку не очень трудно выработать надлежащую линию игры против противника-
машины и все время обыгрывать ее.
Однако существуют машины, которые нельзя обыграть так тривиально. Предположим, что машина
через каждые несколько игр делает перерыв и использует свои способности для другой цели. На этот
раз она не [c.256] играет с противником, но исследует все предшествующие партии, записанные у нее в
памяти, чтобы определить, какие веса различных оценок фигур, господства, подвижности и т.п.
приводят чаще всего к выигрышу. Таким образом, она учится не только на своих неудачах, но и на
успехах противника. После этого она заменяет свои прежние оценки новыми и начинает играть как
другая, лучшая машина. Такая машина уже не будет иметь жесткой индивидуальности, и приемы,
бывшие прежде успешными против нее, потерпят в конце концов неудачу. Более того, она может
стечением времени усвоить нечто из стратегии своих противников.
Все это очень трудно осуществить в шахматах, и на практике метод не был разработан настолько, чтобы
создать машину, способную играть в шахматы как мастер. Шашки представляют более легкую задачу.
Равноценность фигур значительно уменьшает число рассматриваемых комбинаций. Кроме того, отчасти
вследствие этой однородности, шашечная игра гораздо легче делится на отдельные стадии, нежели
шахматная. Даже в шашках главная задача эндшпиля уже не в том, чтобы брать фигуры, а в том, чтобы
входить в контакт с противником, добиваясь позиций, позволяющих брать фигуры. Оценка ходов в
шахматной партии должна делаться независимо на различных стадиях. Не только эндшпиль отличается
от миттельшпиля в важнейших отношениях, но и в дебютах выдвижение фигур в положение,
обеспечивающее свободу движений для нападения и защиты, имеет гораздо большее значение, чем в
миттельшпиле. Поэтому мы даже приближенно не можем удовольствоваться равномерной оценкой
различных весовых факторов для игры в целом, но должны разбить процесс обучения на ряд отдельных
стадий. Только тогда можно надеяться на создание обучающейся машины, которая сумеет играть в
шахматы как мастер.
В этой книге уже упоминалась, в связи с задачей предсказания, идея сочетать программирование
первого порядка, которое может быть о ряде случаев линейным, с программированием второго порядка,
в котором для выбора стратегии, применяемой при программировании первого порядка, используется
гораздо больший отрезок прошлого. Предсказывающее устройство использует [c.257] ближайшее
прошлое полета самолета для предсказания будущего при помощи линейной операции; но отыскание
правильной линейной операции есть статистическая задача, в которой долгое прошлое этого полета и
прошлое многих подобных полетов используются для получения статистической основы.
Статистические исследования, необходимые для того, чтобы почерпать из долгого прошлого стратегию,
предназначенную для короткого прошлого, являются в высшей мере нелинейными. Так, при
использовании для предсказания уравнения Винера Гопфа³ коэффициенты уравнения разыскиваются
нелинейным методом. В общем случае обучающаяся машина действует при помощи нелинейной
обратной связи. Шашечная машина, описанная Сэмьюэлом
и Ватанабе
, может выучиться обыгрывать
своего программиста вполне закономерным образом после 1020 рабочих часов программирования.
Философские идеи Ватанабе о применении программирующих машин чрезвычайно интересны. С одной
стороны, метод доказательства элементарной геометрической теоремы, оптимальным образом
отвечающий определенным критериям изящества и простоты, рассматривается Ватанабе как обучение
игре, но не против индивидуального противника, а против, так сказать, полковника Боуги
. Другая
игра, исследуемая Ватанабе, ведется при логической индукции, когда, желая построить теорию,
оптимальную в таком же квазиэстетическом смысле, исходя из оценки экономичности, прямоты и т.п.,
|