Крауднаукинг, или почему меня больше не раздражает капча.

Все, больше никогда не буду злиться на капчу!
Оказывается, распознавая ее, я помогаю оцифровывать книги
И это называется Крауднаукинг

Цитата:
Знаете ли вы, что вы - вот лично вы собственной персоной, - сами того не замечая, помогаете оцифровывать архивы печатных изданий и целые библиотеки на разных языках?

Есть такая многими проклинаемая штука под названием рекапча. Вы хотите скачать файл, допустим, и тут выскакивает окошечко с парой волнообразно изогнутых слов - и вы должны их прочесть и собственноручно напечатать в поле для ответа. Слова вечно исполнены всякими дурацкими шрифтами (особенно часто попадается английский "газетный" шрифт), часто бывают на разных языках, нередко оказываются плохочитаемы - уууу, какая мерзость, почему нельзя поставить обычные цветные циферки, перечеркнутые парой-тройкой разноцветных косых линий?

А оказывается, что к этой капче подсоединена хитрая программа, которая берет слова не из воздуха, а из базы отсканированных, но плохо поддающихся распознанию документов - например, подборок New York Times за тыща девятьсот мохнатый год. (Вот откуда газетный шрифт!) Вырезает слово как картинку, изгибает его слегка, тоже как картинку, вставляет в окошко капчи и предлагает вам.
[img]http://yoush.homelinux.org:8079/ira/Из%20интернета/recaptcha_pic2.jpg[/img]
А дальше интересно. В окне для распознавания у вас всегда не одно, а два слова. Одно - то самое нераспознанное и неоцифрованное morning, зато второе - overlooks - системе уже известно. И человеком она вас засчитывает, если вы правильно напечатали overlooks. Неизвестное ей слово morning вообще можно не вводить, и вас все равно пустят куда вам надо! Но вы не знаете, какое слово система знает, а какое предлагает наугад, поэтому честно перепечатываете оба. И вот тогда, признав вас по одному из них человеком, система берет morning, которое не могла распознать, и складывает предложенное вами его написание в специальную ячейку, где уже лежат варианты, предложенные другими пользователями, которых тоже признали людьми. Капчей пользуются миллиарды людей по всему миру, поэтому ячейка наполняется быстро. Очень скоро уже можно увидеть, что, допустим, 45 человек из 50 увидели в этом слове morning (остальные пять ошиблись, недоглядели, промахнулись мимо клавиши - mornig, morgen, monring). И вот когда в следующий раз при оцифровке той же New York Times компьютер в очередной раз споткнется, он сравнит изображение этого слова с тем, которое нашлепнуто на нашу ячейку и возьмет из этой ячейки правильный ответ morning, который мы с вами вводили с простой и привычной ему клавиатуры. Бинго!

Каждый день ничего не подозревающее население Земли с помощью капчи оцифровывает сто миллионов новых слов. Среди нас живет семьсот пятьдесят миллионов человек, которые помогли оцифровать по меньшей мере одно слово. Посмотрите в зеркало - не исключено, что там вы увидите одного из них.


Отсюда
Да здравствует капча! Ура!

Комментарии

Аватар пользователя Isais

Хм. Про распознавание слов при капче я и раньше слыхал, а что второе слово не сильно важно, вижу объяснение впервые, но сам уже сталкивался не раз - точно знаю кажется, что в одном слове опечатался, но файлохранилище пустило и не пискнуло. Вот, значит, почему...
И да, словарная капча всё полезней, чем пресловутая Анархистская матан-капча.

Хорошо бы из проекта 90-томного СС Льва нашего Толстого сделали для Рунета Толстой-капчу. Мигом бы распознали всё собрание сочинений, и без волонтеров.

Isais написал:
Хорошо бы из проекта 90-томного СС Льва нашего Толстого сделали для Рунета Толстой-капчу. Мигом бы распознали всё собрание сочинений, и без волонтеров.
Только страницы, где Толстой пишет по-французски и то диакритика будет безнадежно испорчена.
Аватар пользователя Никос Костакис

laurentina1 написал:
Посмотрите в зеркало - не исключено, что там вы увидите одного из них.

Троха я си тащу... (с)

Цитата:
Вырезает слово как картинку, изгибает его слегка, тоже как картинку, вставляет в окошко капчи и предлагает вам.

Ага, слегка изгибает, слегка уменьшает четкость, и все только для того, чтоб лучше распознавалось.
Если б не было этого "слегкаизгиба", я бы может и поверил в сказку о великой пользе капчи. Особенно для Нью Йорк Таймс.

Кстати. Если все мы помогаем распознавать оцифрованные газеты, книги и т. п., то они должны быть в публичном доступе, для всех. Почему-то про это в восторженной статейке скромно умалчивается.

reCAPTCHA - штука неоднозначная, но она применяется и работает.

только уже говорилось, что гугл распознает(да и вообще оцифровывает) книги не для людей, а для тренировки своего поиска, и будущего ИИ(который ваяют опять же для лучшего поиска, по их заверениям), к ним недавно на работу перешел один из ведущих спецов в этой области.

HEPO написал:
только уже говорилось, что гугл распознает(да и вообще оцифровывает) книги не для людей, а для тренировки своего поиска, и будущего ИИ(который ваяют опять же для лучшего поиска, по их заверениям), к ним недавно на работу перешел один из ведущих спецов в этой области.

И что?

а то, смысл от этого распознанного текста если его никто из людей не увидит а просто будет в бд у них? Да и сам гугл давно перестал быть "Корпорация добра"

А. Тогда вопрос снят.

это чего - чем больше качаешь порнухи через LetItBit, тем больше отцифровываешь "архивы печатных изданий и целые библиотеки на разных языках"?

ну "целые библиотеки на разных языках" - это я могу, это мне не жалко!

а вот какой-нибудь мерзопакостный New York Times - я не желаю! ещё чего - блядским амерам помогать!!!

fixx написал:
это чего - чем больше качаешь порнухи через LetItBit, тем больше отцифровываешь "архивы печатных изданий и целые библиотеки на разных языках"?

ну "целые библиотеки на разных языках" - это я могу, это мне не жалко!

а вот какой-нибудь мерзопакостный New York Times - я не желаю! ещё чего - блядским амерам помогать!!!

Авотхуй!
Никуда ты не денешься и будешь оцифровывать New York Times! Нихто тебя и спрашивать не будет! Хочешь порнуху с Летитбита смотреть - будь добёр оцифровывать что-нибудь амерское! Другое, с неанлийским алфавитом, просто невозможно по этой технологии. Все же знают, что капчи всегда строго с английскими букваме! Этапатамушта енти буквы есть на всех клавиатурах всехкампутерофф! Вот! А руских букаф на фсех нихватаит! Нуивот! Такшта не придцца ентим метадам ацефровэвать руские книшки, а тока амерский New York Times!
Аминь!

Zadd написал:
fixx написал:
это чего - чем больше качаешь порнухи через LetItBit, тем больше отцифровываешь "архивы печатных изданий и целые библиотеки на разных языках"?

ну "целые библиотеки на разных языках" - это я могу, это мне не жалко!

а вот какой-нибудь мерзопакостный New York Times - я не желаю! ещё чего - блядским амерам помогать!!!

Авотхуй!
Никуда ты не денешься и будешь оцифровывать New York Times! Нихто тебя и спрашивать не будет! Хочешь порнуху с Летитбита смотреть - будь добёр оцифровывать что-нибудь амерское! Другое, с неанлийским алфавитом, просто невозможно по этой технологии. Все же знают, что капчи всегда строго с английскими букваме! Этапатамушта енти буквы есть на всех клавиатурах всехкампутерофф! Вот! А руских букаф на фсех нихватаит! Нуивот! Такшта не придцца ентим метадам ацефровэвать руские книшки, а тока амерский New York Times!
Аминь!

да я!!! только что бы блядские Нью Йоркские Времена не цифровать - парнуху смотреть не буду!!!

до полной победы над блячдской Америкой с ихими Нью Таймсами!!!

Всё так, только я никогда не видел, чтобы нераспознанное слово "слегка изгибали". Обычно одно слово изуродовано до состояния FUBAR, а второе мутноватое, но неискажённое (не было бы мутноватое - его бы и без вас автоматом распознали). И я уже давно где-то читал, что "прямое" слово можно не вводить - на реакцию капчи это не повлияет. Писали ещё, что есть специальная секта борцов, которые вместо "прямого" слова нарочно всякую херню вводят, чтобы гуглу насолить.

А ведь точно, пару раз сомневалась, что правильно распознала слово, но все получалось
И на Депозите сейчас одно слово - одно число, иногда число вводить и не требуется, а иногда - обязательно

Verdi1 написал:
Писали ещё, что есть специальная секта борцов, которые вместо "прямого" слова нарочно всякую херню вводят, чтобы гуглу насолить...

я, пожалуй, вступлю в эту секту!

буду "БуйВам" ввсегда вводить! ну или - на крайний случай "Leck Mich An Den Eiern!"

fixx написал:
Verdi1 написал:
Писали ещё, что есть специальная секта борцов, которые вместо "прямого" слова нарочно всякую херню вводят, чтобы гуглу насолить...

я, пожалуй, вступлю в эту секту!

буду "БуйВам" ввсегда вводить! ну или - на крайний случай "Leck Mich An Den Eiern!"


Такими длинными конструкциями никто уже не пользуется, теперь по простому "Leck mich im Arsch"

laurentina1 написал:
Такими длинными конструкциями никто уже не пользуется, теперь по простому "Leck mich im Arsch"

А Бендер в германской локализации что говорит?

Это к переводчикам, намудрили

laurentina1 написал:
fixx написал:
Verdi1 написал:
Писали ещё, что есть специальная секта борцов, которые вместо "прямого" слова нарочно всякую херню вводят, чтобы гуглу насолить...

я, пожалуй, вступлю в эту секту!

буду "БуйВам" ввсегда вводить! ну или - на крайний случай "Leck Mich An Den Eiern!"


Такими длинными конструкциями никто уже не пользуется, теперь по простому "Leck mich im Arsch"

у меня баушка - немка Поволжья, она не умела по современному!

fixx написал:
laurentina1 написал:
fixx написал:
Verdi1 написал:
Писали ещё, что есть специальная секта борцов, которые вместо "прямого" слова нарочно всякую херню вводят, чтобы гуглу насолить...

я, пожалуй, вступлю в эту секту!

буду "БуйВам" ввсегда вводить! ну или - на крайний случай "Leck Mich An Den Eiern!"


Такими длинными конструкциями никто уже не пользуется, теперь по простому "Leck mich im Arsch"

у меня баушка - немка Поволжья, она не умела по современному!

Вот так, поскреби руского патриота, а у него - баушка-немка.
А, ежели хорошо проверить, так и деушка-масон найдётся (как у Ильича)))))

sem14 написал:
fixx написал:
laurentina1 написал:
fixx написал:
Verdi1 написал:
Писали ещё, что есть специальная секта борцов, которые вместо "прямого" слова нарочно всякую херню вводят, чтобы гуглу насолить...

я, пожалуй, вступлю в эту секту!

буду "БуйВам" ввсегда вводить! ну или - на крайний случай "Leck Mich An Den Eiern!"


Такими длинными конструкциями никто уже не пользуется, теперь по простому "Leck mich im Arsch"

у меня баушка - немка Поволжья, она не умела по современному!

Вот так, поскреби руского патриота, а у него - баушка-немка.
А, ежели хорошо проверить, так и деушка-масон найдётся (как у Ильича)))))

да-с! русские патриоты онэ такие!

ходил я как-то в 90-е на заседания общества Память. так там ни кого и поскребать не нужно!

я сначала думал - поймали ...эээ ну тех - кто из крана воду выпивает, пороть будут, а оказалось не поймали, а онэ сами пришли! да не просто пришли... онэ, оказывается, в руководителях ходят!

а ещё у меня друг есть! русский патриёт, и казацкий атаман Святозар Соломонович Барух!

тяжело ему быть русским патриотом и атаманом! притесняют! даже в Израэле притесняют!

в синагогу с шашкой не пущают! да и на работе, на кафедре, косо смотрят! хихикают! "а не жарко ли Вам Святозар Соломонович в бурке?"

Цитата:
Вырезает слово как картинку, изгибает его слегка, тоже как картинку, вставляет в окошко капчи и предлагает вам.

Я не очень понимаю смысл такого процесса. Зачем слегка изгибать текст, то есть усложнять задачу пользователям, если главная цель - научится лучше распознать текст. Зачем его лишний раз искажать?

А на счет того, что эти данные используются для распознавания газет и т.д., есть же программы типа FineReader, которые отлично справляются с этим....

подобные программы надо покупать, выделять железо. а тут просто раздавать людям куски картинок, и они уже сами распознают, причем точнее) прикмньте вычислительные можщности как разнятся=)

Похоже я только что фотографию номера дома распознавал. Поставил 11 вместо 10. Файл с diles скачал

Неконструктивные вандалы все вы. Конструктивнее всего было бы вообще не вводить расшифровку для "прямого" слова. И сами лишний раз не вспотеете, распознавая, и не напортите ничего. Но некоторых человеков бастурмой не корми - дай напакостить, нагадить. И ведь вроде бы не англичанки. Хотя Берии сейчас нет, некому проверять.

*категорично* Бастурму не ем!

Аватар пользователя Никос Костакис

Лом написал:
*категорично* Бастурму не ем!

Мне вместо "бастурма" всегда хочется сказать: "мастурба" - и я ее тоже не ем.

Мне тут недавно на глаза статистика попалась, согласно которой употребление в пищу шавермы стоит где-то на третьем месте в списке причин заболевания гепатитом С. После чего я любовно посмотрел на сарай с дровами для шашлыка

Аватар пользователя Никос Костакис

Лом написал:
Мне тут недавно на глаза статистика попалась, согласно которой употребление в пищу шавермы стоит где-то на третьем месте в списке причин заболевания гепатитом С. После чего я любовно посмотрел на сарай с дровами для шашлыка

Ага. И ее не ем - как поглядишь, сколь жирны да ядрены мухи, ползающие по ней, да как вспомнишь видео о том, как да из чего она готовится - буэээ...

Никос Костакис написал:
ке причин заболевания гепатитом С. После чего я любовно посмотрел на сарай с дровами для шашлыка

Ага. И ее не ем - как поглядишь, сколь жирны да ядрены мухи, ползающие по ней, да как вспомнишь видео о том, как да из чего она готовится - буэээ...

У меня один знакомый работал в колбасном цеху, подруга жены на кондитерской фабрике. Мы последнее время просим их не рассказывать случаи из производственной практики...

Лом написал:
Никос Костакис написал:
ке причин заболевания гепатитом С. После чего я любовно посмотрел на сарай с дровами для шашлыка

Ага. И ее не ем - как поглядишь, сколь жирны да ядрены мухи, ползающие по ней, да как вспомнишь видео о том, как да из чего она готовится - буэээ...

У меня один знакомый работал в колбасном цеху, подруга жены на кондитерской фабрике. Мы последнее время просим их не рассказывать случаи из производственной практики...
Я в школьные годы работала на УПК в кондитерском цеху лучшего в городе ресторана Мир.
Готовые торты и пирожные до сих пор не ем, уже лет 30

Аватар пользователя Никос Костакис

laurentina1 написал:

Я в школьные годы работала на УПК в кондитерском цеху лучшего в городе ресторана Мир.
Готовые торты и пирожные до сих пор не ем, уже лет 30

Мой приятель лет двадцать пять работает на мясокомбинате в колбасном цехе. Говорит, крысы, которые раньше нередко попадали в колбаску, давно исчезли - мясо не используется, а соевое дерьмо жрать они не дуры.

Никос Костакис написал:
Мой приятель лет двадцать пять работает на мясокомбинате в колбасном цехе. Говорит, крысы, которые раньше нередко попадали в колбаску, давно исчезли - мясо не используется, а соевое дерьмо жрать они не дуры.

С исчезновением крыс мясо в колбасу перестало попадать даже по случайке.
Аватар пользователя Никос Костакис

Verdi1 написал:

С исчезновением крыс мясо в колбасу перестало попадать даже по случайке.

(ностальгирует)

Verdi1 написал:
Никос Костакис написал:
Мой приятель лет двадцать пять работает на мясокомбинате в колбасном цехе. Говорит, крысы, которые раньше нередко попадали в колбаску, давно исчезли - мясо не используется, а соевое дерьмо жрать они не дуры.

С исчезновением крыс мясо в колбасу перестало попадать даже по случайке.

довели блядские либералы страну...

а ведь обещали и две Волги ГАЗ 24 за ваучер (или за чубайс?), и двести сортов калабасы, и клубнику по утрам...

да-с...

но с другой стороны - и тараканы вымерли, и крысы исчезли, а мы ещё ...

laurentina1 написал:
Лом написал:
Никос Костакис написал:
ке причин заболевания гепатитом С. После чего я любовно посмотрел на сарай с дровами для шашлыка

Ага. И ее не ем - как поглядишь, сколь жирны да ядрены мухи, ползающие по ней, да как вспомнишь видео о том, как да из чего она готовится - буэээ...

У меня один знакомый работал в колбасном цеху, подруга жены на кондитерской фабрике. Мы последнее время просим их не рассказывать случаи из производственной практики...


Я в школьные годы работала на УПК в кондитерском цеху лучшего в городе ресторана Мир.
Готовые торты и пирожные до сих пор не ем, уже лет 30
Я работал на шоколадной фабрике в славном городе Нацрат-Элит. Ел, ем и буду есть.

sem14 написал:
laurentina1 написал:
Лом написал:
Никос Костакис написал:
ке причин заболевания гепатитом С. После чего я любовно посмотрел на сарай с дровами для шашлыка

Ага. И ее не ем - как поглядишь, сколь жирны да ядрены мухи, ползающие по ней, да как вспомнишь видео о том, как да из чего она готовится - буэээ...

У меня один знакомый работал в колбасном цеху, подруга жены на кондитерской фабрике. Мы последнее время просим их не рассказывать случаи из производственной практики...


Я в школьные годы работала на УПК в кондитерском цеху лучшего в городе ресторана Мир.
Готовые торты и пирожные до сих пор не ем, уже лет 30

Я работал на шоколадной фабрике в славном городе Нацрат-Элит. Ел, ем и буду есть.
Тоже мне сравнил...

laurentina1 написал:

Тоже мне сравнил...

у моей барышни мама и старшая сестра работают на шоколадной фабрике "Россия" в славном городе Самара. и барышня моя на "России" подрабатывала. в каникулы.

так нам шлют и шлют шоколад, а мы кушаем! и ничего! не смотря на рассказы!

а рассказы - это у всех рассказы!

даже у немцев рассказы!

то в контейнере с какао-бобами нашли труп африканского африканца!

то конкурс - кто в какао-бобах найдёт самого большого Мадагаскарского "шоколадного" таракана!

любителям шоколада - категорически не читать!

Аватар пользователя s_Sergius

laurentina1 написал:
Лом написал:
У меня один знакомый работал в колбасном цеху, подруга жены на кондитерской фабрике. Мы последнее время просим их не рассказывать случаи из производственной практики...

Я в школьные годы работала на УПК в кондитерском цеху лучшего в городе ресторана Мир.
Готовые торты и пирожные до сих пор не ем, уже лет 30

Было дело, в студенческие времена подрабатывал на мясокомбинате в убойном цехе. Вообще ничего мясного сначала есть не хотелось. Дня два. А потом ничего...

s_Sergius написал:
laurentina1 написал:
Лом написал:
У меня один знакомый работал в колбасном цеху, подруга жены на кондитерской фабрике. Мы последнее время просим их не рассказывать случаи из производственной практики...

Я в школьные годы работала на УПК в кондитерском цеху лучшего в городе ресторана Мир.
Готовые торты и пирожные до сих пор не ем, уже лет 30

Было дело, в студенческие времена подрабатывал на мясокомбинате в убойном цехе. Вообще ничего мясного сначала есть не хотелось. Дня два. А потом ничего...


Мой сын подрабатывал, но не в убойном отделе, а в соседнем - кашрута.
Ел, ест и будет есть антрекоты.

sem14 написал:

Мой сын подрабатывал, но не в убойном отделе, а в соседнем - кашрута.
Ел, ест и будет есть антрекоты.

..эээ Антрекот из кошерной свинины?

а у меня знакомый друг в убойном отделе работает!

да-с... убийц всяких ловит. ловил, ловит, и будет ловить!

fixx написал:
sem14 написал:

Мой сын подрабатывал, но не в убойном отделе, а в соседнем - кашрута.
Ел, ест и будет есть антрекоты.

..эээ Антрекот из кошерной свинины?

а у меня знакомый друг в убойном отделе работает!

да-с... убийц всяких ловит. ловил, ловит, и будет ловить!


...И ЕСТЬ???

laurentina1 написал:

...И ЕСТЬ???

пока только в тюрьму сажает!

наверное, несъедобные пока попадаются!

fixx написал:
sem14 написал:

Мой сын подрабатывал, но не в убойном отделе, а в соседнем - кашрута.
Ел, ест и будет есть антрекоты.

..эээ Антрекот из кошерной свинины?

а у меня знакомый друг в убойном отделе работает!

да-с... убийц всяких ловит. ловил, ловит, и будет ловить!


Патриоты про коров слышали?
Или знакомые израильские казаки-соломоновичи им не рассказывали?

sem14 написал:

Патриоты про коров слышали?

слышали!

но не уважаем мы коров!

из коровы - сало не вкусное получается! не патриотическое какае-то сало!

Аватар пользователя s_Sergius

s_Sergius написал:
laurentina1 написал:
Лом написал:
У меня один знакомый работал в колбасном цеху, подруга жены на кондитерской фабрике. Мы последнее время просим их не рассказывать случаи из производственной практики...

Я в школьные годы работала на УПК в кондитерском цеху лучшего в городе ресторана Мир.
Готовые торты и пирожные до сих пор не ем, уже лет 30

Было дело, в студенческие времена подрабатывал на мясокомбинате в убойном цехе. Вообще ничего мясного сначала есть не хотелось. Дня два. А потом ничего...

И много нового узнал тогда. Например, что «карбонат» это не только химическое соединение, а «козел-провокатор» — вовсе не ругательство.

думаю там есть какая нибудь защита. Например одну и ту же картинку несколько раз показывать. И если придут одинаковые значения - то запомнить. Это самое элементарное что проходит в голову)

Аватар пользователя Никос Костакис

Какие-то косяки с цитированием, причем не только у меня. Приходится вручную править.

X