LINUX.ORG.RU

Stylus for UNIX


0

0


Появился первый (насколько мне известно) open-source англо-русский
переводчик. Новорожденный проект называется "Правда". Добро пожаловать
сюда:

http://prawda.newmail.ru

С первой попытки значительно превзойти Stylus не удалось. Однако
переводчик "Правда" имеет свои преимущества.

Перед "Правдой" ставилась задача получать грамматически корректный
перевод "фраза в фразу". С этой задачей она с некоторой вероятностью
справляется. (Если автор текста, например, индийского происхождения
не допустил грамматических ошибок. Если допустил, то все - компьютер
мысли не читает...) Но как всякий "тупой компьютер", "Правда" совершенно не чувствует контекст. Выбор нужного варианта перевода, соответствующего контексту, лежит на человеке. "Правда" предоставляет для этого более или менее удобные средства. Таким образом "Правда"
берет на себя рутинные операции (насколько может), оставляя
творческую часть перевода человеку (Кхм... ставлю подмигивающий смайлик ;-)).

Нынешняя версия первая, но не последняя. Желающие принять участие
в этом проекте, или желающие выссказать свое мнение прошу писать мне.

prawda@newmail.ru

Буду рад узнать мнение об этой программе программистов, математиков, лингвистов, переводчиков, и просто юзеров.

Дима Анисимов.

>>> Подробности

anonymous

Проверено: svyatogor

А немецко-русский будет?

kHertz
()

2Дима Анисимов : спасибо !

anonymous
()

Мне название проекта понравилось ;)))

Rost ★★★★★
()

Антикоммунистам выколем глаза

anonymous
()

Чего-то ИМХО вы гоните, на счет единственного open-source переводчика... Мне кажется словари Мюллера прикрученные к dictd куда как удобнее.

anonymous
()

Re:

А у вас нет желания сделать Х-ый GUI? или что бы и там и там работал...Имхо консоль - не всегда удобно...

LineReader
()

Ай молодца:) А почему название такое, если не секрет?

anonymous
()

хм RH9 - не сбилдилось
SIGSEGV у g++

anonymous
()

не надо путать *словарь* и *переводчик*

anonymous
()

Имхо пока не начнется использование нейросетей переводчики так и не будут "чувствовать" контекст.

P.S. Но посмотреть на это интересно - уже качаю. Может даже сегодня соберу и скормлю ему "настоящий" текст. :)

jackill ★★★★★
()

непонятно только зачем стилус приплели. я уж подумал грешным делом..

anonymous
()

Ну всё, вот и пришел долгожданный конец Слаки ! Ура товарищи, да здраствует RedHat !

anonymous
()

Ааа, это переводчик - извините.

anonymous
()

В скриншоты кто-нибудь заглядывал? Как вам слово #фигня# в переводах? ;-)

walrus
()

Good job!!!! Thanks .

anonymous
()

>> Имхо пока не начнется использование нейросетей переводчики так и не будут "чувствовать" контекст.

Имхо, вполне возможно прописать контекстные зависимости "вручную". Хотя, если найти достаточный объём переведённых дословно текстов для тренировки нейросети, всё будет гораздо проще. Только вот где бы их раздобыть?

Авторам: спасибо огромное, но поработать вижу вам придётся ещё изрядно.

bugmaker ★★★★☆
()

Дословных - это нехорошо. В том-то и смысл, чтобы обучать кусками, по предложениям, абзацам и т.п. Иначе как ты различишь контекст?

jackill ★★★★★
()

make[1]: Leaving directory `/root/soft/prawda/bin'
./zcompress1 e         # сделать словари
./zfrasa_verb
g++ -E -I../grammar -o ../grammar/lang.txt ../grammar/lang.cpp
mkdir -p ../doc
mkdir -p ../doc/html_grammar
mkdir -p ../doc/html_src
./zmkdoc
./zgrammardoc
rm: cannot remove `grammar.more': No such file or directory

make: *** [all] Segmentation fault

:/

vinzz
()

ну так вподе ничего словарик у меня под Слакой встал без проблем довольно приятноя весчь буду ждать GUI версию а шляпа всетаки отстой :)

anonymous
()

Автору "Правды" - молодец, дельную вещь сделали!
Только в раделе "Скачать" ошибка - R_a_d Hat вместо ожидаемого RedHat.
Сам тон текстов на сайте слишком дурашливый.

При запуске (из сырцов, конечно - ПРИВЕТ слакваристам! :)
программа ./prawda_x вообще не запускается, ./prawda просит уже 5 минут подождать загрузку данных. Это так и должно быть? :(

P.S. Был бы багтрак, не писал бы в конфу! :(

Skull ★★★★★
()

Блин, отъел 100МБ. Как насчёт оптимизации использования памяти? :(

Skull ★★★★★
()

прикольно. счас буду смотреть...

anonymous
()

мда... дурное дело не хитрое. особенно без серьезной лингвистической поддержки кучи языковедов нормальный переводчик одному программеру не написать.

более того, перевод сделанный слово в слово придется корректировать дольше, чем переводить самому вручную с Мюллером под боком.

только не говорите, что вас удовлетворит дословный перевод типа "дважды ударьте по пуговице" (dobleclick the button).

anonymous
()

Нда, работать и работать... :)
(c microsoft.com)
Microsoft announces the future release of Windows Storage Server 2003,
the next version of network attached storage. Read about the new features
and advancements in this dedicated file server.
----------- перевод --------------------------
#фигня# Microsoft сообщать the будущий освобождение о окно хранилище server 2003 the следующий версия о network прикреплять хранилище .
#фиг# прочитайте около новые особенности и продвижения в этом посвятили файл ## server .

Самая недостающая фича: очиста буфера английского текста. А также разбиение по строкам скопированных из Konqueror текстов.

Skull ★★★★★
()

Автора!!!

Где мыло автора? Куда писать гневные письма????!

Skull ★★★★★
()
Ответ на: комментарий от vinzz

> rm: cannot remove `grammar.more': No such file or directory
Забей! После этого make install и всё прекрасно ставится... :)

Skull ★★★★★
()

было правильным запостить эту новость и куда-то в тусовку языковедов, лингвистов, etc.. Думаю те, кто при памяти могли б оказать помощь..

anonymous
()

Вот если прикрутить туда "говорящий" и "распознающий речь" модули...

anonymous
()
Ответ на: комментарий от anonymous

> Skull ты чо слепой. сверху мыло написано
Ага, слепой! Перепутал веб-адрес и email. @ не заметил :) Прошу прощения...

Skull ★★★★★
()

>> Дословных - это нехорошо. В том-то и смысл, чтобы обучать кусками, по предложениям, абзацам и т.п. Иначе как ты различишь контекст?

Хм, дословных - я имел в виду переведённых "предложение в предложение", перевод максимально близкий к исходному тексту. А кусками обучать имхо суксь и маздай, так как контекстная зависимость есть не только у слов, но и у многих предложений, и даже у абзацев, хотя более слабая. Чтобы её выявить, нужен достаточно большой набор достаточно длинных текстов с точными переводами и преогромная нейроматрица. А если учить кусками, вдобавок с учётом понятийных связей, матрица нужна имхо поболее, времени намного больше, и получится в конце концов не переводчик а самый настоящий искусственный разум :|, что хоть и интересно но напоминает гильотину в роли лекарства от перхоти.

>> без серьезной лингвистической поддержки кучи языковедов нормальный переводчик одному программеру не написать.

Для каждого языка существует формализованный набор правил. Если бы их удалось выразить в математической форме (а это вполне возможно, трудность по большей части лишь в терминах), то написание переводчика свелось бы к тупому надавливанию на кнопки, т.к. пересечение множеств системы понятий и правил для их выражения давало бы практически _однозначность_ соответствия исходного текста и перевода (за редким исключением идиом и других подобных вещей, которые в свою очередь могут быть просто фиксированы в сравнительно небольшом списке исключений).

bugmaker ★★★★☆
()

Насегодня без ГУЯ не получишь ничего!

Жду ГУЯ. Потом и будем смотреть

anonymous
()

Насчёт формализованного набора правил --- "не надо грязи" :-)
В языке далеко не всё формализуемо.

Но по мере сил готов помочь с проектом, особенно, когда дело дойдёт до немецко-русского.

А.П.

AP ★★★★★
()

Неплохо для начала - надо бы поприкручивать всякие
стандартные средства типа configure ;)

Кстати а может Автору выпустить это (L)GPL библиотекой а спецы по
интерфейсам прикрутят GUI какие им нравятся ?

sS ★★★★★
()

коментарий такой:

идея хорошая и нужная а вот с точки зрения попробую посоветовать что то. Переводчик должен иметь интерфейс и не завязываться на конкретную реализацию GUI, то есть переводчик сам по себе и GUI само по себе, переводчик предоставляет свой интерфес для пользавания, GUI этот интерфейс пользует. Это хорошо с той точки зрения что клиентов можно будет писать всяких разных, например из Emacsa иметь доступ к этой фишке

вобщем client-server катируется

lg ★★
()

На счёт большёго количества текста для обучения

Есть куча книг выпускаемых на разных языках, а если учесть устойчивость нейро сетей к шумам, то при наличии достаточного количества быстрых компьютеров наверно возможно получить очень неплохой переводчик, или интелект.

С уважением, "Ламер"

opeg
()
Ответ на: комментарий от AP

точно - вот я бы сделал бы emacs frontend к этому

lg ★★
()

2opeg: Вы не могли бы пояснить свой тезис касательно книг?

AP ★★★★★
()

2opeg: Вы не могли бы пояснить свой тезис касательно книг?

AP ★★★★★
()

Замечания по инсталляции:

1) Установка производится /usr, а не в /usr/local, что не есть хорошо.
2) makefile ничего не знает об uninstall, что в сочетании с п.1 просто
чудовищно ;-)
3) Запускаемый файл устанавливается в /usr/share/prawda/prawda/bin/
и никакого линка в каталог из $PATH не производится.

Резюме: лучше использовать automake/autoconf :-)

Саму программу пока не запускал, сейчас попробую...

anonymous
()

to: А я люблю Retrans :)

The FFII is organizing an online demonstration against software patents. We want you to replace the title page of your project's site with a protest page against software patents (for examples see below) on August 27th.

FFII организует диалоговое выявление против патентов программного обеспечения. Мы хотим вы к заменяете титульный лист вашего проектного места с возражать страницу против патентов программного обеспечения (например смотри ниже) в августе 27-я.

За "Минимальная комплектация (общая и деловая лексика)" $290

Без комментариев.

anonymous
()

>> В языке далеко не всё формализуемо.

Исключений сравнительно мало (зависит конечно от языка). Даже если их не учитывать, всё равно большую часть обычного текста можно формализовать без проблем. Смотри, например, элементарный учебник грамматики и сосчитай процент предложений, не соответствующих указанным там правилам :). Другое дело, что есть много неоднозначностей из-за избыточности информации, но при правильно указанных понятийных зависимостях это влияет _только_ при генерации текста-перевода. Это сравнительно небольшая проблема, т.к. при любом раскладе сможем получить вполне читабельный текст.

>> то при наличии достаточного количества быстрых компьютеров

Проблема в том, что нейросеть нужно сначала выучить. Это долгая и трудоёмкая работа.

bugmaker ★★★★☆
()

2bugmaker: Ну а как быть с нерамочной конструкцией предложений?

AP ★★★★★
()

Кстати а чего версия для иксов привязана к конкретному фонту ?

sS ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.