Nov. 15th, 2012

zmeyka_taya: (Default)
Сегодня утром по БизнесФМ меня опять атаковали бананотехнологии. За 2 млн рублей в Питере собираются разработать программу мониторинга интернет-контента. Она по набору ключевых слов будет лазить по СМИ и соцсетям и отслеживать, кто ругательски ругает действующую власть. И погрешность требуется не более 20% (по радио сказали 2%, но, видимо, оговорились).

Я же тут распиналась уже про порог целесообразности для перехода от экспертного решения к автоматизированному, да? Так вот здесь IMHO этот порог не то что далеко, а где-то вообще в космосе. Задача грубо делится на две части: 1) поиск, 2) аналитика. Агрегатор поисковых запросов по редактируемым критериям наваять - дело нехитрое, через готовые-то поисковики. А вот с аналитикой возникает вилка: либо, условно говоря, два живых человека сидят и глазами вычитывают результаты, выдаваемые агрегатором, т. е. фактически выполняют ту же работу, что и до наносистемы - либо второй живой человек постоянно, непрерывно отслеживает языковые тенденции в соцсетях и на лету меняет логику. Ну, типа появилась манера хвалить словами "кошмар-кошмар" - человек лезет в списки и меняет знак с отрицательного... нет, не на положительный, а на "хрен его знает". Чтобы что? правильно, чтоб первый живой человек отсмотрел контекст.

То есть экспертная группа делает все ровно то же самое, что и до наношпиона. Возникает резонный вопрос: куда и, главное, зачем уплывают два лимона?

PS. Мне ещё понравился комментарий, который по радио давал какой-то чувак из РАН (Фомин? Фокин?). Человек вроде корректно разъясняет, что в такой постановке задача нереализуема, а реализуемое стоит 10-15 т.р. - а метатекстом отчетливо слышится: "Они что, идиоты?.."


А! Вот ещё тут пишут, по радио про это не было:

Кроме того, Смольный уделяет повышенное внимание личностям самих блогеров. Система будет сравнивать аккаунты, чтобы в итоге установить: за этой страницей в Facebook, этим юзером в ЖЖ и этим пользователем "Твиттера" стоит один и тот же человек. Кроме того, по мере возможности программа должна представить данные по имени, полу, возрасту, образованию и даже месту жительства блогера. Особенное внимание будет уделено тем, кто оставляет много положительных публикаций, и тем, кто, наоборот, слишком много критикует работу конкретного чиновника или ведомства.

:facepalm: :facepalm: :facepalm:

Profile

zmeyka_taya: (Default)
zmeyka_taya

September 2017

S M T W T F S
     12
34 56 789
10111213141516
17181920212223
24252627282930

Style Credit

Expand Cut Tags

No cut tags
Page generated Oct. 20th, 2017 09:26 pm
Powered by Dreamwidth Studios