http://knop.livejournal.com/ ([identity profile] knop.livejournal.com) wrote in [community profile] ru_chgk2010-12-23 01:40 am

Тестирование и защита от утечек

При подготовке этого ОКРа я достаточно жестко сформулировал редакторской группе ограничение на тестпрование - каждый из индивидуальных тестеров, получивших вопросы электронной почтой, должен увидеть не более 50% всего пакета.

Большое спасибо ребятам за то, что они с честью выполнили это условие. Да, им в результате было тяжелее. Да, возможно (хотя и не факт), что разрешение на привлечение каждого из тех же тестеров к 100% пакета позволило бы сделать ОКР лучше. Я не собираюсь лезть в бутылку и утверждать, что этого не могло бы случиться.

Я хочу обратить общее внимание на то, ради чего это было сделано. Речь идет прежде всего о защите репутации команд и тестеров. Чтобы не могла возникнуть (повториться) очень неприятная во всех смыслах ситуация "твой друг тестировал пакет, а ты на нем удачно сыграл - поэтому я считаю, что вы с другом жулики". В ситуации 50% тестирования обвинение в жульничестве почти наверняка будет отбито простой арифметикой: берем те 50%, которые видел данный тестер, и сравниваем результат данной команды на этих вопросах с ее же результатом на остальных. Если большой разницы нет - то какие могут быть претензии? (А если разница действительно неправдоподобно велика - то это уже повод привлечь дисциплинарную комиссию, и пусть она разбирается...)

Сразу же хочу отметить, что я вовсе не пытаюсь обвинить кого-либо в "преднамеренных сливах" даже чисто теоретически. Надо осознавать, что в нашем мире существуют возможности утащить письмо из чужого почтового ящика так, что ни его владелец, ни автор письма этого даже и не смогут заметить. Более того, поскольку в качестве тестеров часто привлекаются одни и те же люди, то их ящики находятся под большей угрозой, чем остальные. И это еще одна причина, по которой не хочется отсылать людям весь пакет целиком: даже если взломщик узнает заранее половину ответов, он будет очень остерегаться пользоваться этим знанием. Поскольку чтобы не привлечь к себе внимание, на второй половине придется _честно_ показывать сравнимый результат.

Если сейчас никто не приведет сверхмощных аргументов, почему такую практику нельзя продолжать в дальнейшем, то на всех последующих синхронах, к которым я имею отношение, а также на взрослом ЧР, это условие для привлекаемых тестеров будет повторено.

[identity profile] set-chemist.livejournal.com 2010-12-22 10:45 pm (UTC)(link)
метод компарирования в действии (:

почему бы и нет, собственно

[identity profile] max-petrovi4.livejournal.com 2010-12-22 10:49 pm (UTC)(link)
Подскажите, а как можно узнать список синхронов, к которым Вы имеете отношение?

[identity profile] theindifferent.livejournal.com 2010-12-22 10:53 pm (UTC)(link)
Знают ли тестеры о других участниках тестирования? Вольны ли они собираться в стаи для группового тестирования отдельных вопросов? Поощряется ли это групповое тестирование?

[identity profile] max-petrovi4.livejournal.com 2010-12-22 10:55 pm (UTC)(link)
Спасибо!

[identity profile] andy-racing.livejournal.com 2010-12-22 10:56 pm (UTC)(link)
Ну раз объявлялась благодарность нескольким командам - в принципе против группового тестирования, надо полагать, никто не возражает :)

[identity profile] luck243.livejournal.com 2010-12-22 11:09 pm (UTC)(link)
умно. Правда умно - достаточно простая, но, ИМХО. действенная система. Конечно, как оно будет в реальности - будет видно через некоторое время, но мне лично нравится.

[identity profile] linnando.livejournal.com 2010-12-22 11:10 pm (UTC)(link)
Да, очень хорошая идея.

[identity profile] linnando.livejournal.com 2010-12-22 11:12 pm (UTC)(link)
А в чём проблема с тем, чтобы просто считать команду одним участником? Тогда ограничения на пересылку, вроде, нет.

[identity profile] albert-alef.livejournal.com 2010-12-22 11:12 pm (UTC)(link)
Константин, при всём уважении, это похоже на парною.
Хотя идея блестящая.

[identity profile] theindifferent.livejournal.com 2010-12-22 11:15 pm (UTC)(link)
Я вообще-то имел ввиду нечто вроде такого:
https://spreadsheets.google.com/ccc?key=ts7OSxamlT5GtUKrycXsXwA&hl=en&authkey=CL2n45oP#gid=0
Документ, подготовленный редактором, вмещающий в себя матрицу вопросов, известных каждому игроку. Любой из тестеров может зайти на страничку и увидеть, что вопросы под номерами 9-12 первого тура знают еще и такие товарищи. С ними можно командно оттестировать эти вопросы или, по крайней мере, обменяться мнениями.

[identity profile] ondrean.livejournal.com 2010-12-22 11:15 pm (UTC)(link)
У меня есть одно серьёзное возражение.
Если ни один тестер не видит пакета целиком, то оценка общего качества и стиля пакета остаётся исключительно в ведении редактора (редакторов). Из-за этого теряется чуть ли не самый важный аспект тестирования - возможность тестера сказать фразу типа "У тебя в пакете недопустимо высокий процент вопросов с заменами / вопросов по бардовским песням и кинцу / метасвязок / вопросов с раздатками / вопросов моносовского стиля / вопросов белкинского стиля / гуманитарного знания / недочётов в области русского языка / вопросов на инсайт / чёрт знает чего ещё". Если бы я протестировал, скажем, полпакета ОКР, а вся вторая половина оказалась бы посвящена советскому кинематографу, Юрию Кукину и братьям Стругацким, то мне было бы стыдно, что моё имя стоит в шапке пакета в числе тестеров, и я попросил бы его оттуда убрать. По-моему, такая угроза репутации тестеров гораздо серьёзнее, чем та, которую ты упоминаешь в посте.
Собственно говоря, на этом ОКР то самое и случилось: пакет оказался выдержан в одном стиле, видимо, импонирующем Вадиму Молдавскому и остальным редакторам, но совершенно неприемлемом для многих команд и игроков. Возможно, привлечение большего количества компетентных тестеров топ-уровня помогло бы смягчить эффект.

[identity profile] linnando.livejournal.com 2010-12-22 11:19 pm (UTC)(link)
Если честно, я не думаю, что этот стиль был заметен только на целом пакете и не был заметен на его половине. Мне кажется, стиль любой его половины был таким же, как и у пакета в целом.

[identity profile] max-petrovi4.livejournal.com 2010-12-22 11:28 pm (UTC)(link)
Свежеизобретенная схема позволит чаще находить основания для подобных обвинений. Тем самым подкармливая паранойю.

[identity profile] e-rubik.livejournal.com 2010-12-22 11:29 pm (UTC)(link)
"Угроза репутации тестеров" - это сильно.
Во-первых, список тестеров все равно никто не читает.
Во-вторых, за плохое качество пакета ругают редакторов, а не тестеров.
В-третьих, даже редакторы, написавшие плохой пакет, через некоторое время успешно получают право делать еще один.

И еще. Если бы ты редактировал первую половину пакета, а вторая половина, сделанная другим редактором, оказалась бы посвящена советскому кинематографу, Юрию Кукину и братьям Стругацким, тебе было бы стыдно, что ты участвовал в создании этого пакета?

[identity profile] ondrean.livejournal.com 2010-12-22 11:30 pm (UTC)(link)
Вот не знаю. Если отдельные туры редактируют разные группы, а всё вместе сводит топ-ред (который принимает окончательное решение о том, какие вопросы ставить и какие слова и стиль в этих вопросах употреблять), то общий стиль ловится только по пакету целиком.
Скажем так: 24 вопроса редактора, который (пусть и невольно) последовательно издевается над русским языком, сыграть можно. При большом фанатизме и моральной устойчивости можно рискнуть сыграть 36. Но 48 убивают мозг и желание когда-либо ещё играть в ЧГК напрочь.

[identity profile] max-petrovi4.livejournal.com 2010-12-22 11:32 pm (UTC)(link)
Во-первых, неправда.
Во-вторых, неправда.

[identity profile] gimser.livejournal.com 2010-12-22 11:32 pm (UTC)(link)
Неправдоподобная разница на сравнении 2 "подпакетов" по 24 вопроса? В каждом конкретном случае ничего не даст, скорее всего, хотя вреда тоже не видно. Например раскладка 8-22 - подозрительная (сумма 30 вроде давала очень приличное место)? По мне так не очень, уж больно мала выборка. Для более крупных пакетов может быть оправдано.

Мы однажды на КуПРе взяли 6-0-10 - хорошо, что тогда по турам никто не отслеживал правдоподобность...

[identity profile] max-petrovi4.livejournal.com 2010-12-22 11:33 pm (UTC)(link)
Теперь будут.

[identity profile] e-rubik.livejournal.com 2010-12-22 11:35 pm (UTC)(link)
1. Вы помните тестеров предыдущего турнира, который вы играли?
2. Пруфлинк?

Page 1 of 12