dupchecked22222../4ta/2chb/795/41/english110304179521740747313 完全著作権フリーな英語辞書つくりませんか?◎正当な理由による書き込みの削除について:      生島英之とみられる方へ:

完全著作権フリーな英語辞書つくりませんか?


動画、画像抽出 || この掲示板へ 類似スレ 掲示板一覧 人気スレ 動画人気順

このスレへの固定リンク: http://5chb.net/r/english/1103041795/
ヒント:5chスレのurlに http://xxxx.5chb.net/xxxx のようにbを入れるだけでここでスレ保存、閲覧できます。

1 :英一郎:04/12/15 01:29:55
辞書機能を備えたソフトを作ろうとしたら、辞書のライブラリでフリーのもの無いんですね…
英辞郎にしたって、結局どこがフリーじゃって感じしますし。
そんなわけで完全著作権フリーで誰もが自由に使える辞書作りませんか?
もちろん辞書データベースソフトはフリーで公開する予定です。

そこで聞きたいんですが、
どんな機能があったらプロジェクト立ち上げ時のしょぼい段階の辞書に協力する気になりますか?
あと、何か著作権云々でこれは気をつけとけ!ということありますか?

2 :名無しさん@英語勉強中:04/12/15 01:32:35
ににににいいいににいににんんんいんにににににんい

3 :うんこ:04/12/15 01:43:35
>>1
すばらしい考えだな。俺も協力するよ。
細かい機能はいらないから、どんなにマイナーな単語でも例文は最低1つはのっけてほしい。
ちゃんと一文になってるやつを。


4 :名無しさん@英語勉強中:04/12/15 01:48:32
>>1
ちゃんとした辞書からとった発音記号を載せて欲しい

5 :名無しさん@英語勉強中:04/12/15 04:24:49
英辞郎も結局アレだからな・・・

6 :名無しさん@英語勉強中:04/12/15 04:25:35
関連ツールも必ずフリーつーことで

7 :名無しさん@英語勉強中:04/12/15 04:36:08
電子辞書買った方が早いよ

8 :名無しさん@英語勉強中:04/12/15 04:51:11
英一郎はたて逃げか?

9 :名無しさん@英語勉強中:04/12/15 07:45:16
様々な言語にWordNetがあるけど、英語のWordNet
はフリー。それ以外のWordNetはライセンス料がかかる。日本のEDRも、もうすぐフリー?

10 :英一郎:04/12/15 12:49:14
これからこのスレを保守していきますが、基本的に出没はPM11:00です。
着手は諸事情にて1月中旬から、

このスレの目的は
「著作権フリーの英語辞書(ライブラリ)」
を作成することが目的です。
ですが、さすがにライブラリだけを作ろうとしても人が寄らなそうなので、
辞書ソフト壱号機は私が作ります、もちフリーです。
あと、なるべく皆さんの協力をリアルタイムで反映させるためにサーバーも立てるつもりです。ウィキペディアみたくできたらいいんですが技術上どこまで可能かは分かりません。(この辺は未体験ゾーン…)
恐らく、このライブラリが充実してくれば辞書ソフトは多くの支援者によっていろんなバージョンが作成されると期待しています。
また、このライブラリを搭載した翻訳ソフトなんかもでるかもしれません。

現状では、辞書ライブラリを搭載したソフトを作成する際、ソフト作者は辞書ライブラリの著作権に縛られ個人レベルでは思うように辞書を進化させることができません。そこで自由に使用でき、編集できる辞書がこの世に存在したらと思いこのスレを立てました。

とりあえず製作に入る前にやりたいこと
1.フリーのライブラリがあるならそれが欲しい
 0から作るよりずっと楽になるため
 ★「英語のWordNet」これそのまま取り込んじゃっていいんですかね?
  後で調べてみますが知ってる方ヨロです。
2.基本フォーマットの作成
 どんなデータがあると辞書として役に立つか
 ★発音記号
 ★例文
3.著作権上の注意点
 後になって公開差し押さえは勘弁してもらいたい


11 :名無しさん@英語勉強中:04/12/15 14:13:12
英一郎君、頑張ってくれ。

12 :名無しさん@英語勉強中:04/12/15 14:32:40
語源を充実させて下さい。すべての単語に語源説明をするくらいの勢いで
お願いします。

13 :名無しさん@英語勉強中:04/12/15 21:31:26
こんな感じはどう?

http://www.thefreedictionary.com/blood%20sugar

辞書に登録されていない単語は、Googleでサーチできるように
ボタンが用意されている。

14 :名無しさん@英語勉強中:04/12/15 23:12:15
>>1
一応、外国語板で似たようなことをやったので、データの権利とかで
何を考えないといけないかなど考える足しにはなるかも。
途中、かなり荒れてるので、読みにくいかもしれないけど、注意深く読めば
色々得るところもあると思います(例えば、どうやって単語を集めるかなど)。
このときの成果は韓国語2600語くらいの単語集。

■■■ 辞書開発スレッド ■■■
http://academy3.2ch.net/test/read.cgi/gogaku/1085298865/l50

15 :名無しさん@英語勉強中:04/12/15 23:30:05
面白そうなアイデアだと思うけど、
1が想定しているものがどういうものなのか、いまいち分からない。
ライブラリって何ですか。

16 :名無しさん@英語勉強中:04/12/16 00:05:09
「辞書ライブラリ」って、プログラムのことを言ってるのね。
勘違いしてました。 >>14 はデータ作成のスレなので、無視してください。

17 :名無しさん@英語勉強中:04/12/16 00:07:16
>>15
辞書を調べてみよう! 多義語だから、どの意味かはあいまいだが。

18 :名無しさん@英語勉強中:04/12/16 00:19:22
>>16
その一方で英辞郎を出しているから良く分からない
英辞郎は辞書データだよな.「辞書データベースソフト」なんて言い方もしてて,
結局何を作りたいんだか...

「著作権フリーの英語辞書(ライブラリ)」って何なのさ.


19 :15:04/12/16 00:57:57
私の解釈では
「1は辞書プログラムを作る。英語板住人は辞書データを作る。」
ってことだと思ったんですけど。
1の書き方はあいまいでよく分かりません。

20 :英一郎:04/12/16 00:59:12
もうこんな時間か…
辞書の話で「ライブラリ」は確かに混乱を招きました、スンマセン。

ライブラリ…データの集合体(EIJIRO81.DIC)
辞書ソフト…データの集合体を扱うアプリケーション(PDICW32.EXE)

と考えてください。
オンライン作者の立場から見ると「辞書ソフト」は一人で作れる代物ですが、その中身のデータファイルというのは当然ながら一人ではとても作れません。
ですが、世の中にある英和辞書データはおそらく全て著作権によって保護されており、一個人の作ったソフト上で自由に扱うことができません。
たとえば学習する辞書ソフトを作ったとしましょう。
このソフトは「英辞郎」や「GENIUS」のデータを取り込めたとします。
その際、ある人が一生懸命使ってそのデータベースを二倍に拡張したとします。
それでも、元に「英辞郎」や「GENIUS」の著作権が存在するために、その人の拡張されたデータを第3者へ配布することができないのです。
あくまで、個人利用にとどまってしまうわけです。
つまりどこまでも辞書データを成長させていくために必要な基本データを作成しようと言うわけです。

コンセプトは英辞郎とまったく同じでそれを完全フリーでやり抜こうということです。
でも、せっかくやるからには辞書データとして魅力的な情報を持たせてやりたいと考えています。
せっかちな話かもしれませんが、このデータベースに『乗せるべきデータ様式』をマッタリ話し合いませんか?
------------------------------
例:patientという単語を調べた結果
発音記号:peisens
語源:耐え忍ぶ者
名詞:医学:患者
形容詞:一般:忍耐強い、辛抱強い
例:ンマフフ
------------------------------
てな感じ

21 :英一郎:04/12/16 01:10:35
ちなみに英辞郎だと
1英単語:patient
2発音記号:pe@iSnt
3日本語訳:
 【@】ペイシャント、ペイシェント、【変化】《複》patients、【大学入試】
 【形】我慢強い、根気よく働く、辛抱強い、忍耐強い、隠忍自重する、我慢する、堪忍する、気長な、気が長い、寛容な
 【名】我慢しなければならない人、患者、病人
4用例:【用例・形】 Be patient. : 我慢してください
5単語レベル
6暗記必須単語
の6項目で構成されています。

私的には、日本語訳や用例をもっと細かく区分したほうがいいかなと思ってます。
例えば、
単語の使われる状況:
[名詞] [医学] 患者
など、名詞の場合は使われる環境を大まかに示したりするとどうかな?とか考えてます。

22 :名無しさん@英語勉強中:04/12/16 01:13:41
>>20
なるほど。僕も参加させてください。

僕の希望を言わせてもらうと、どの単語と結びつくか(コロケーション)が欲しい。
それも、既存の辞書にあるような数個だけっていうんじゃなくて、
どんどんデータベースを拡張できるようにしてほしい。
具体的にいえば、コマンドに、
「この単語の用例をデータベースに追加する」
「この単語の用例を見る」
があればいいなと。

patientなら、英英辞書を引くと、
elderly patient, ill patient, AIDS patient, cancer patient,
help the patient, treat the patientなどが載ってるけど、
これを自分で追加していけるような。

23 :英一郎:04/12/16 01:13:43
他の参考リンクはまた後ほど見させていただきます…

24 :うんこ:04/12/16 01:19:47
みんな頑張ろうな!!

25 :名無しさん@英語勉強中:04/12/16 01:21:11
>>うんこ君
がんばるのはいいんだが、君はそのコテハンもうちょっと何とかならんのか?

26 :うんこ:04/12/16 01:24:16
>>25
うんこって何か楽しい感じしない?気楽に頑張れる気がして・・・
うんちならOK?

27 :名無しさん@英語勉強中:04/12/16 11:52:10
きたない。あと例文を作れる人間はまず皆無だろうからかなり難しい作業だと思う。
出典のチェックネイティブチェック校正チェックときりがない。
一応学生時代辞書編纂の手伝いした経験あり。

28 :名無しさん@英語勉強中:04/12/16 14:27:46
別にネイティブチェックなんていらないんじゃないの。
売るわけでもないし。
自分で改変できるってのがいいんであって、
信頼度を求めるなら普通の辞書引けばいいじゃん。

29 :名無しさん@英語勉強中:04/12/16 14:41:32
電子辞書持ってるからイラネ

30 :名無しさん@英語勉強中:04/12/16 15:19:35
どうせ1がソースを持ち逃げしてシェアウェアにでもするんだろ?

31 :名無しさん@英語勉強中:04/12/16 15:21:50
30が核心ついたところで




          -終了-





32 :名無しさん@英語勉強中:04/12/16 16:30:05
ってのは嘘ぴょーん

33 :名無しさん@英語勉強中:04/12/16 16:49:06
ってのは嘘ぴょーん


34 :名無しさん@英語勉強中:04/12/16 18:35:42
-終了-

35 :名無しさん@英語勉強中:04/12/16 19:21:49
WordNetがある

-終了-

36 :英一郎:04/12/17 01:14:52
名無しさん@英語勉強中の発言は発言内容のレベルがぶっ飛んでるのでいざスレッド立ててみると理解に苦しみますね…
今一番の収穫は「WordNet」です、まさにこれをやろうと考えていたのであるならいいです。

     -終了-


37 :英一郎:04/12/17 01:15:20
ってのは嘘ぴょーん

38 :英一郎:04/12/17 01:16:51
ってのも嘘ぴょーん

39 :英一郎:04/12/17 01:39:25
…疲れてるな俺。

とりあえず基本データはWordNetを丸々コピーしてシステム作ってみます。
実際に着手できるようになるまでまだ時間がありますので、少しでも協力者を煽るためにもフリー辞書データのメリットを上げていきますね。

>>29 「電子辞書で充分」
普通に考えると浅はかな気がしますが、あまり煽ると公開時に叩かれるので穏やかに説明します。
中学受験や英語学習目的の辞書の使用であれば市販の英語辞書で充分、というよりかそれを選択するべきです。
でも、データを有効に活用したシステムを作成する場合、市販のデータは個人利用に限り改変できますが、皆で共有することは現実的に難しくなります。(お金がかかる)
特に特定の辞書のデータだけで充分な場合などは中学受験位ではないでしょうか?

今考えている中で有効活用を上げてみると、文章翻訳時に最適単語を選出する機能なんか付けられるかもしれません。
たとえば文章を丸々読み込ませて、その中にどんな単語が含まれているかを解析させます、するとどういった内容の文章か大まかにジャンル別に区分けすることができます。
そのジャンルにあった訳語を優先的に表示するといった機能はあったら便利かもしれません。
また、未来の話ですが、たとえばある人が人工知能の作成を個人レベルで始めたとします。
もちろん言語学習が必要になるわけですが、その際フリー辞書を使えば著作権にとらわれず自由に公開できたりします。
多言語翻訳、英->日 英->韓 の辞書がある程度できたとします、するとこれを元に日<->英 英<->韓 日<->韓 なんてものが作れます。
つまり皆が二つの言語を充実させると全ヶ国語辞書が作れちゃうわけです。まぁこれらはバビロンとかの辞書会社は普通にやってると思いますが、がんばりゃ俺らでもできるんではないでしょうか?
まぁ結局、辞書を引くだけの人にははじめは全くメリットがないかもしれませんが、完成したらほんとにスゲープロジェクトだと思います。

またにー

40 :名無しさん@英語勉強中:04/12/17 01:47:07
市販の辞書ってどの位著作権持ってるの?
例えばこのスレで作成する辞書にhungryの用例を入れる場合、
I'm hungry(低級レベルで申し訳ない・・・)
って自分で考えたとしてこの文を入れるとするじゃん?
市販の辞書のhangryの用例が同じI'm hungryだとしたら
著作権違反でアウトってことになるの?

41 :名無しさん@英語勉強中:04/12/17 10:52:00
>>40
というか市販の辞書でも例文はよく他所のをぱくってるよ。


42 :名無しさん@英語勉強中:04/12/17 11:03:58
版権が切れた書籍からの転載でしかも部分的に改変しているなら、特に断らなくても
いいという慣例はある。逆にシェークスピアとか有名なものは断っておく方が高級に
見えたりもする。著作権は今厳しくてインターネット上でも訴えられる場合もあるし
原告勝訴の判決も出ているから、もう甘くはなくなってきているよ。

43 :名無しさん@英語勉強中:04/12/18 19:55:16
アメリカ人になればいいよ。マジでw

44 :英一郎:04/12/18 23:50:21
WordNetの仕様を見ていると日本語版WordNetができればそのまま英語、日本語、英和、和英辞書ができちゃいますね。
上位語、下位語、等位語の概念すら知らなかったから勉強になりました。
日本語版WordNetの作成を検討しているところってあるんですかねぇ?
ググッた感じじゃ見当たらないんですが。

著作権について
>>40-41
余り詳しくないんだけど、答えてくれる人がいないみたいなんで可能な限り答えます。
一般的には、「一般的に広く知られている事実」は著作権には触れません。
だから
「お腹がすいた:I'm hungry」
なんかがたとえ他の辞書に載っていてもそれを使用することは問題ありません。
だからといって日本語と英語に長けた人が俺はこの辞書内の全ての単語と意味を知っているからといってデータを丸々コピーすることはできません。
ばれなきゃ良いだろうと考える方がいますが、確実にばれます。
というのも普通の辞書(データベース)は「罠」を仕掛けてあるからです。
以前も某地図データベース会社が他の地図データベースをコピーしてばれましたよね。
よくあるタイプの罠は既知の入力ミスです。
入力ミスをあえていくつか取っておくと、データが丸々コピーされた際にそのミスもコピーされます。
もちろんこのミスは「一般的に広く知られている事実」ではないのでこれが複数発覚すると著作権侵害ということになります。
つまり本人がよく耳にしたり、経験的に知っていることを「確認として」他の辞書で調べて新たな辞書に登録することは問題ないと思います。


45 :名無しさん@英語勉強中:04/12/19 13:59:27
っていうか既存の辞書に何か不満でも?
別に新しいものがなくても、英和や英英なら洋書で1000円前後でいくらでも手に入りますが何か?
つーかそんな辞書の造り方も知らない奴が作る辞書をだれが使うんだよw
俺は特殊な英語辞書作ったことあるけど、もっと研究してから作ったぞ。マジで。
そんな浅はかに「自分でも…」とかって思うなら、カエレ

46 :名無しさん@英語勉強中:04/12/19 14:18:05
>>45
お前こそ帰れな。知的障害。

47 :名無しさん@英語勉強中:04/12/20 00:06:43
このスレは終わりましたか?

返信求む

48 :英一郎:04/12/20 01:03:41
いますよ…
>>10 にも書きましたが1月中旬までは他の事が忙しいので、実際にプログラムを作ったりはできません。
その間に、いろいろ構想だけでも練っていきたいと思っています。
今日はちょっと時間を使って、単語を登録するだけのWEBサーバー用のデータベースを作ってみました。
仕様などを先に公開して論議したいのですが、読もうという気のある方います?
まぁ不発にせよ何にせよとりあえず一発は公開するつもりです。
>>45
人それぞれ考え方はあるみたいですが、煽りをするにももう少しスレッド読んでからしてもらいたいです。
でないと返事する気すら失せます。

49 :名無しさん@英語勉強中:04/12/20 12:37:51
フリー辞書はあるみたい。
フリー英英辞書もあるみたい。。
つまり、ありふれた小辞書はいらない。。

50 :名無しさん@英語勉強中:04/12/20 13:21:05
ネットでフリーでなにかやってみたい、と言う気持ちはわかるけど
現実にフリーで”凄い”ものを作るとしても、結局誰かが引っ張らなければ
むりぽ。人気のフリ−ソフト作っている人の中には現実の生活を壊しかねない
状態でがんばっている人もいるくらいだし、雑談でなにか出来るとは正直>>1も考えてないだろ。

51 :名無しさん@英語勉強中:04/12/20 14:55:26
>>49
ほんと?
詳細キボンヌ。

52 :英一郎:04/12/20 15:21:54
昼間はなるべくアクセスしないようにしてるんですけどね…

私が探した限りで日本語辞書は無かったんですが、
あるなら是非とも詳細をお願いします。
かな漢字は結構見つかりました。
http://homepage2.nifty.com/baba_hajime/free-dic/
他にもありましたらよろしくお願いします。(とりあえず英語か日本語)

53 :名無しさん@英語勉強中:04/12/20 17:17:19
英英は
hyyp://wordweb.info/free/
hyyp://www.free-soft.ro/index-en.html (多言語)
hyyp://www.freelang.net/dictionary/index.html (多言語)

英和はベクターなどにあったと思う。

と言う俺はBookshelf使ってるのだけれども。

辞書を作るには多分長い年月が掛かると思うのですが、
データベースを少しずつ追加できる形式だといいのではないでしょうか

54 :英一郎:04/12/20 17:51:02
ウホッ逃避中…
>>50
ネットでフリーウェア公開して人生踏み外し傾向にある人間です…
自慢できるほどのソフトはありませんけど…
もちろん、
常時更新、登録、アクセス可能なサーバー立てて
Windows下でネット接続無しで動くクライアントを作る予定です。
>>53
ありです。後で見てみます。
できれば全データを丸々ダウンロードできるものがいいです。
データ形式は独自であってもフォーマット仕様が分かれば抜き出せます。
もちろん、使用許可付きでないと使えませんがね。

55 :英一郎:04/12/20 17:53:04
今読んでる本:言語の科学3「単語と辞書」(岩波)
単語自体の構成や仕様はこれ読んでから考えます。
細かい点で問題になる例えとして、
●「自動制御」を単語として認めるかとか。
(自動、制御)とばらばらにしても意味が通じかつ意味が変化しないもの
これらはほぼ無限通りの組み合わせが作れるが、時際に使われる言葉は有限数しか存在せず、外国語によってはそれ自体に一単語が割り振られているケースがあるため。
英語で「おにぎり」に相当する単語は無いが2語「rice ball」でなら表現可能な場合、
英語側の単語として「rice ball」は認めるべきであるといった点など。

●データベース仕様
データベースは3グループで構成
1:ネットワーク型単語データベース
単語と単語をつなぐデータベース
例えば
 動物->哺乳類->ネコ
 のような繋がり関係を保存します。
 関係式は
 上位語:「ネコ」の上位語は「哺乳類」、「肉食動物」、「動物」...
 下位語:「鉛筆の」下位語は「色鉛筆」、「赤青鉛筆」...
 等意語:「間違い」の等意語は「ミス」
多言語間でネットワーク上に繋げていこうと考えてますが、上位語、下位語…の定義はまだ決めてません。

2:意味データベース
単語とその意味を連結したもの
時計:時刻を表示したり測定したりする機械

3:等意文データベース
同じ意味を持つ文章
How are you?-ご機嫌いかが?

56 :英一郎:04/12/20 17:54:51
このデータベース仕様をもっと煮詰めて行きたいと思います。
例えば
名詞以外の扱い方
文法のデータベース化
ネットワーク型単語データベースの問題点
下位語の範囲はどこまでか?
単語->単、語
単語->たんご->た、ん、ご
ここまで分けると日本語初挑戦の外人さんにもやさしいかな?
もちろん
単語、単、語、た、ん、ご
は意味データベースと直結させます。

57 :名無しさん@英語勉強中:04/12/20 19:00:00
>>56
最近はアニメの影響か日本語習得しようという人も海外で
増えてきてるみたいですし、ローマ字で引けるようにすれば
いいかもしれないですね。
フリーの百科辞典Wikipediaみたいに誰でも投稿、編集できるよう
なスタイルにすれば独自性も出せるんじゃないかと思います。

58 :名無しさん@英語勉強中:04/12/23 01:23:14
ほうほう。>>46に池沼呼ばわりされたから、経験者がアドバイスしてあげよう。
実際辞書を作るにはコーパスを作る必要がある。ってそれ以前に目的を決めないとコーパスも作りにくい。
例えば「treponema」って単語は、細菌関係の辞書作るなら必要かもしれないけど、それ以外では必要ないだろう。
どっからコーパスのソース集めるかにもよるけど、新聞や雑誌、その他諸々から上位約15000〜30000語も掲載すれば実用には耐える(と思う)。
あと基本語の意味をちゃんとしとくと。他にも重要ポイントはあるけど、あげたらきりないな…
どう?辞書作者がなんで著作権主張したがるか少しはわかったか?
そんな簡単にできるようなもんではないんだよ。>>1よ。
生半可な気持ちで作った辞書には利用価値も見出せない。だって英和辞書くらいネットでタダで引けるしね。

ちなみにマジで作る気があるならいくつかアドバイスしてあげよう。
とりあえず語句を抽出して使用頻度順にソートするプログラムを作成しろ。
意味付けなんていうものは無機質な作業だけど、それ以前にやるべきことがたくさんあるということを知っておいてくれ。
そんじゃ*本気なら*ガンガレ

まあ>>46はもっといいアドバイスをくれるんだろうが。

59 :名無しさん@英語勉強中:04/12/23 01:35:53
>>58
46じゃないが、アフォなのはお前のほうだよ?w
まず >>1 の制作意図がなんであるか全くわかっていないようだ。
それからフリーで物を作る威力というのがどのくらいかもわかっていないようだ。

さらに、
> とりあえず語句を抽出して使用頻度順にソートするプログラムを作成しろ。

こんなもんはプログラムの入門書のはじめのほうに書いてある10数行の
練習問題だぞ。w

60 :名無しさん@英語勉強中:04/12/23 01:52:41
まあ作ってから言ってもらいたいもんだな。
妄想だけなら誰でもできるんだよ。

フリーのものを作る威力?ああ。フリーであることは素晴らしいかもしれない。
しかし、辞書をフリーにしたところで何の意味があるのか?
実際有名辞書からの出典ほど信頼できるデータはないはずだよな。
辞書とかの著作権は信頼という付加価値があることには気付かないようだな。
だってお前ら、「○○××English Dictionaryによると〜」と「コウビルドによると〜」のどっちを信頼するのか。
実際に利用価値がある=内容価値があるものをフリーでどう実現するか、教えてもらおうじゃない?

61 :名無しさん@英語勉強中:04/12/23 01:56:58
フリーの辞書なんぞ作らなくてもWiki1個設置すれば済む話。
自演乙。
参考: WikiPedia

------------------------------------
-------------- 終 了 --------------
------------------------------------

62 :名無しさん@英語勉強中:04/12/23 02:06:11
>>60
お前もしかして英辞郎 thread 荒らしてるバカじゃね?
じゃあ相手しない。w

>>61
俺も Wiki type のやり方が妥当かなと思ってるが、辞書なんだから
format の制定やら tool の作成などほかにもやることは色々あるだろう。
>>1 がどこまでやる気かはわからんが。

63 :名無しさん@英語勉強中:04/12/23 02:10:19
>>62
英辞郎はモノになってるだろ。一緒にするなバカ。
フリーなんて意味を改変可能&創作可能だから信頼性がないんだよ。
そもそも辞書をフリーにする利点は?書いてみ↓

64 :名無しさん@英語勉強中:04/12/23 02:13:07
> > とりあえず語句を抽出して使用頻度順にソートするプログラムを作成しろ。
>
> こんなもんはプログラムの入門書のはじめのほうに書いてある10数行の
> 練習問題だぞ。w

うん、それさえやってないこの辞書は糞だね。
the コーパスなしのパクリ辞書!

65 :名無しさん@英語勉強中:04/12/23 02:23:47
このスレではまっとうな意見も煽りとみなすんだよな。
まるで北朝鮮ニダ。
・辞書を作る大変さ
・著作権に込められた信頼性
を言いたかったんだけど、「フリーで〜」とか言ってるの。
いやいやフリーは素晴らしいよ。ただ危険性もはらんでるだろ。
辞書みたいに規範になるようなもの、それにフリーはどうかと。
作るのは自由だ。大変だがな。ただ「価値を見出す」という壁は越えられないぞ。
あとアドバイス。経験者の意見に耳を傾けてみてはいかがかと。
まあ作る本人の自己満足に口つっこむ必要はないが、最低限の知識の欠落が目立つんだよな。
確かに理論上簡単でもやっていないんなら反論しても笑われるだけ。
受け容れてこそ、完成度がまして、さらに高度なアドバイスが受けられるのでは?

66 :名無しさん@英語勉強中:04/12/23 02:27:07
バ カ さ ら し 上 げ !

>>65
> あとアドバイス。経験者の意見に耳を傾けてみてはいかがかと。

俺の言うことも聞いてくれ〜って事か?www
いらんから。

67 :名無しさん@英語勉強中:04/12/23 02:28:12
このスレではまっとうな意見も煽りとみなすんだよな。
まるで北朝鮮ニダ。

68 :名無しさん@英語勉強中:04/12/23 02:30:39
うんうん、じゃあコーパス作らないでね。絶対に。
で、無知の結晶を辞書にぶち込んでくれ。
世界一信頼性の低い辞書を作って、世界中の笑いものになるがいい。

69 :名無しさん@英語勉強中:04/12/23 02:33:32
>>68
ハイハイ。バイバイね。

誰もお前の指図なんか聞いてないよ。w
お前には関係ないんだからもうこのスレくんなよ。

70 :名無しさん@英語勉強中:04/12/23 02:40:50
> 実際辞書を作るにはコーパスを作る必要がある。ってそれ以前に目的を決めないとコーパスも作りにくい。
> とりあえず語句を抽出して使用頻度順にソートするプログラムを作成しろ。
もうこれを否定する時点で辞書作成の糞さが露呈。
だって辞書作成の常套手段を否定してるんだもんw
あっ一般論否定できるほどの理由があれば反論どうぞ。

> いやいやフリーは素晴らしいよ。ただ危険性もはらんでるだろ。
> 辞書みたいに規範になるようなもの、それにフリーはどうかと。
これに答えられないからってバカ扱い。それこそ知能の低さを世間に知らしめてますねw

> まあ作る本人の自己満足に口つっこむ必要はないが、最低限の知識の欠落が目立つんだよな。
無知を知れ。ぶっちゃけ恥。

> 確かに理論上簡単でもやっていないんなら反論しても笑われるだけ。
> 受け容れてこそ、完成度がまして、さらに高度なアドバイスが受けられるのでは?
これも一般論。一般論否定してどうする。

はい。あなたの知能の低さ、これらに答えられなければ決定ですが、さて…
だって経験者より知ってたら、そりゃすごいわ。表彰モン。ヨッ!この博学者!!

71 :名無しさん@英語勉強中:04/12/23 02:51:03
>そこで聞きたいんですが、
>どんな機能があったらプロジェクト立ち上げ時のしょぼい段階の辞書に協力する気になりますか?
>あと、何か著作権云々でこれは気をつけとけ!ということありますか?
と書いておいて他人の意見聞けないようなやつに建設的なものは何も作れない。
自己満乙。

------------------------------------
-------------- 終 了 --------------
------------------------------------

72 :名無しさん@英語勉強中:04/12/23 03:18:49
>>70
なんか少しは内容のあること書けバ〜カ。

そんだけ長文書いといて、何一つ意味のあること書かれてないじゃないか。w

lexicographer が辞書編纂時にcorpus 使うこと知ってるくらいで経験者?

はぁ?w

バカも大概にしとけよ。

73 :名無しさん@英語勉強中:04/12/23 09:09:03
>>72
いややってないのに、調べ調べ言ってるようなお前はホント馬鹿だな。
フリーのよさも説明できない、知識の欠落を認めない、それならさっさと作ってみろやハゲ。
何一つ意味ないって、お前もなwまず反論できてねーじゃん。日本語も読めないのね。
> バカも大概にしとけよ。
自分へのメッセージですかw
まあ「英語辞書」でもつくってなw

俺も昔英英を作ったもんだが、そんな奴相手に辞書の作り方も知らないのに無知をさらけ出して煽ってる姿は、まるで喜劇をみているようだ。
一般論さえ否定して、状況が悪くなれば馬鹿ですか。そんなunprospectiveな戯言に誰がついてくるんだろうね。
まあ文句言う前にモノを作ってみろや。コーパスなんてことば、俺が来るまで登場してなかったのは、それこそ異常。
あっ馬鹿すぎて相手にされてなかったのね。ごめんごめんw

74 :名無しさん@英語勉強中:04/12/23 09:18:18
>>73
いまさら気付いたのか

75 :名無しさん@英語勉強中:04/12/23 09:36:07
請われていないのにやってきて「アドバイス」を押し付ける香具師って
心にどこか欠陥があるよね。

実社会で誰からも認められていない腹いせを2chでやりたいのかな。
実際、迷惑だよ。

76 :名無しさん@英語勉強中:04/12/23 10:47:27
>>75
>そこで聞きたいんですが、
>どんな機能があったらプロジェクト立ち上げ時のしょぼい段階の辞書に協力する気になりますか?
>あと、何か著作権云々でこれは気をつけとけ!ということありますか?

77 :名無しさん@英語勉強中:04/12/23 10:56:50
フリーの英和辞書は存在するから要らない

終了

78 :名無しさん@英語勉強中:04/12/23 10:58:27
>>76

>>45,58 のどこにその質問への回答が書いてあるのかな〜?w
おばかさんw

79 :名無しさん@英語勉強中:04/12/23 11:46:26
請われてもいないのにしゃしゃり出てきて
聞かれてもいない質問に答え、
ちっぽけな経験を威張りちらし、
意味のない自己弁護だけを繰り返す。

正直言って、あんた出てくる必要あったの?w >>45,58

80 :名無しさん@英語勉強中:04/12/23 21:23:29
何も生産しないでただ>>1の精神が分裂してるスレはここですか?

81 :名無しさん@英語勉強中:04/12/23 23:07:44
Welcome FREE !!!!!!!!!!!!!!!!!!
?LOVE FREE STUFF !!!!!!!!!!!!!!!!
真の学者根性でパクらず一つ一つ作っていって欲しい。

82 :名無しさん@英語勉強中:04/12/23 23:09:02
みんな頑張ってつくってな。俺はできたやつを頂くだけでいいや。

83 :名無しさん@英語勉強中:04/12/23 23:20:44
>>82
同意

84 :名無しさん@英語勉強中:04/12/23 23:25:16
まず、電子辞書のReaders、Readers Plus、大ジーニアスをテキスト化する。
次に、例文や発音記号などを削除して、見出語とその語義(多義語の場合には、
コンマで区切る)を抜き出して、保存する。
保存したデータと、英痔瘻の見出し語と語義とをperlなどの言語で比較させる。
見出し語と語義が共通するものは、「著作権」が発生しないので、perl
でテキストファイルに書き出す。

これで、20万語程度の英和辞書は自動的に作成でき、著作権もないので
自由に配布できる。

85 :名無しさん@英語勉強中:04/12/23 23:51:51
まず、電子辞書のReaders、Readers Plus、大ジーニアスをテキスト化する。
次に、例文や発音記号などを削除して、見出語とその語義(多義語の場合には、
コンマで区切る)に「にょ」を付けて、保存する。


86 :英一郎:04/12/24 00:41:01
なんか知らない間にスレが伸びてますね…
そういえばクリスマスですねー、引きオタの私にゃ暮らしづらい時期になりました。
一人で映画館行ったら職務質問でもされるんじゃないかと心配ッス。
>>58
スレタイが「辞書」ですがこれから作ろうというものは今まで僕らが使っている辞書とはちょっと違うものです。
そもそもこれまでの「辞書」は人間が直接使用することを前提に製作されたものであり、紙に記録されていました。
そのため、容量や直感的な検索の容易さ(あいうえお順)が重要でしたが、今回作ろうとしている「辞書」はコンピューターを介して使うことが前提となっています。
だからコパース云々ではなく単語の収集対照は存在するもの全てを対象とします。
単語管理、分類は当然あいうえお順等ではなくWordNetに似た概念を用いたいと思うのですが、中々いい案がないのが現状です。
あと、フリー辞書のデメリットを挙げているようですが、メリットもあるということををよく理解してください、
それがあなたにとって魅力的でないものであっても、それを魅力的に感じる人がいるということを理解してください。
>とりあえず語句を抽出して使用頻度順にソートするプログラムを作成しろ。
どういう意味で言ってるか判断し辛いのですが、数百メガの単位のソートを言ってるのであればプログラミング入門程度ですし、数ギガオーダーのインデックスに対して行うのであれば上級者向けですよね…。

87 :英一郎:04/12/24 00:42:25
>>60
頼むからスレッド読んでくれ、あなたが言っている例では市販辞書が最適選択肢です。
フリーの辞書のメリットは、
●誰でも組み込み再配布が行える:
例:しりとりゲームや言葉遊び的なゲームの内部辞書
人工会話システムの内部辞書
オンライン作者の作る自動翻訳機の辞書
●不特定多数の人間によって随時拡張可能
同人語、ごく一部の人間しか使わない語、等も登録閲覧可能
通常辞書にない崩れた言葉も調べることが可能

88 :英一郎:04/12/24 00:47:15
あと、
●フィードバックが受けれる
オンラインで公開した際、どんな単語が検索されてるか等が分かる
>>61-62
ウェブ公開のタイプはWikiっぽいのが妥当ですよね。
ツール製作も基本的には問題ありません。
一番のネックがデータフォーマットです。これを何とかこのスレッドで解決したいと思ってます。

89 :英一郎:04/12/24 00:57:49
やっと本題。
単語をどうやって管理するか?
基本的に単語は何でも登録可能にします。
そして、単語と単語を<>=で繋げて行きます。
これは>>55
1:ネットワーク型単語データベース
の事です。
あれから少し拡張して、この関係の糸に強度のパラメーターを追加することにしました。
例えば
肉食動物 > ネコ
肉食動物 > ウサギ
と登録されたとします。
今回は明らかに間違っているものを例にしましたが単語の中には微妙なものが多数あります。
これを見た人はその関係が正しいと思ったら+,間違い(一般的でない)と感じたら-を加えることができるようにしようと考えています。この場合は修正が最適ですけどね^^;
で今悩んでる問題点
こういったネットワーク上の関係式は、明らかな事実には有効なんですが感情的な単語にはとても不向きなんです。「美しい」「早い」等、特に形容詞の管理には向いていません。
これをどういう風に管理したらよいかいい知恵ありましたらお願いします。

90 :英一郎:04/12/24 02:02:10
やっぱ欲張りすぎかなぁ
先ず普通に英和辞書を作ってみるべきかな?


91 :名無しさん@英語勉強中:04/12/24 10:47:33
未知の領域に踏み込んでいってください

92 :sage:04/12/24 17:37:25
EDRは、9年以上の歳月と180億円を投じたが、
大きな問題点があった。

成功することを祈っている。

93 :名無しさん@英語勉強中:04/12/25 00:46:03
英和作る→属性つける→プログラム側で対応→┐(´ー`)┌'

94 :名無しさん@英語勉強中:04/12/25 11:29:27
フリーは製品にたたかれるなぁ
がんがれ

95 :名無しさん@英語勉強中:04/12/25 16:30:20
叩かれる理由は他にもry

96 :英一郎:04/12/25 22:40:46
口だけじゃ何なので簡単なサーバー作ってみました。
http://dictionary.hiroishi.org/
家の普通のPCに繋げてるんで絶対いたずらしないでください。
ログはスマンが取らせていただきます。
HTML文法が無茶苦茶なのでIE6限定です。
私が私用に使うときはサーバー切ります。
本格始動は1月下旬ですけどね。

97 :名無しさん@英語勉強中:04/12/25 22:46:43
オントロジーの設計は、初めにきちんとやらないと、
大問題になる。

98 :英一郎:04/12/25 22:58:02
データフォーマットはまた後で公開します。

これはとりあえず本気だということを示すのと、
初めてのサーバー構築のテストです。

99 :名無しさん@英語勉強中:04/12/26 01:55:02
( ´∀`)はじめの一歩

100 ::04/12/26 07:10:32
作りたい辞書のイメージがよくわからないんだけど
英和辞書にこだわるのってなんなんだろう。

とりあえず、BasicEnglishとVOAの基本単語をまとめたPDICは例文付きで
作ったものがあるけどね。
でもちょっと目的が違うのかなぁ。
英語が使えるようになる為ってわけではないんだよねぇ。

最近は写真とか絵とかをリンクさせる方法を考えてるんだけどね。
素材は集まって来てるから。
北大の単語リストとかレベルわけに便利だと思うけど、基本1万語ぐらいだったかなぁ。

ちょっと長くなりました。すみませんです。

101 :名無しさん@英語勉強中:04/12/26 16:33:31
『月刊言語』2003年5月号
「辞書を作ろう――編者とユーザーの急接近」

読んだ?

102 :名無しさん@英語勉強中:04/12/26 17:06:44
>>55
>1:ネットワーク型単語データベース
> 上位語:「ネコ」の上位語は「哺乳類」、「肉食動物」、「動物」...
> 下位語:「鉛筆の」下位語は「色鉛筆」、「赤青鉛筆」...
> 等意語:「間違い」の等意語は「ミス」
何やら生成文法的な発想と似てる気が・・・
>>89のような方法を取るにしても、
こういう分野にまで手を出してしまうと収拾が付かなくなりそうな予感。
参考までに、意味の繋がり(類義語)を表す面白い試みとして、こんなのを見つけました↓
http://www.visualthesaurus.com/

>2:意味データベース
>単語とその意味を連結したもの
>時計:時刻を表示したり測定したりする機械
特に英英を使いこなせないレベルの人には、
こういう説明的な英和があったら役に立ちそう。

103 :英一郎:04/12/26 18:28:26
とりあえず構想としてのフォーマットをアップしました。
時間が無いのでゆっくりとここの意見を取り入れつつ更新していきます。
>>100
できることならその辞書を公開していただけると助かります。
辞書のイメージについてはまたあとでアップします。
>>101 読んでみます
>>102 こちらも月曜明けくらいには読んでおきます。
なにぶん今余裕の無い状態なのでごめんなさいです。
http://dictionary.hiroishi.org/

104 ::04/12/27 18:58:52
終わらぬストレスと追い討ちをかける不眠症で気ー狂いそ。
これで学位もらっても職なしだもんなぁ…
よのなかだいきらい。
この悶々としただーくなぱわーでこのプロジェクトは動いてたりします。
>>101
辞書を作ろうの特集ページは全て読みました。
スゲー勉強になりました。
ぼんやりと思い描いていた輪郭に実線が引かれた感じッス。
著作権についても結構都合よいことが書かれていてほっとしました。
>>102
単語のネットワーク機構についてはまず間違いなく収集がつかなくなるでしょう。
でもそれは人間から見たらの話でプログラム的には問題ないと考えています。
もちろん如何にルールと管理を組むかが問題なんですけどね。
無作為にリンクの張られたwwwも検索サーチエンジンがあれば目的のものにたどり着けるのと同じ理屈です。
Yahoo!的な管理じゃ無理だと思いますが、googleみたいな管理ができたらと思ってます。
抽象的でスミマセン。

またフォーマット仕様を後日変更します。
いつもの時間は眠れないので今日はもう寝るよ。

105 :名無しさん@英語勉強中:04/12/27 19:21:13
>>98
> これはとりあえず本気だということを示すのと、

ある程度ちゃんとしたものを作ってからにしたら?
現時点での本気度を示されてもねぇ。

単語帳iアプリとか作ってたときに辞書を作るのが面倒だったから、
何にでも使えるフリーの辞書があればいいとは思うけど、これじゃ叩きようがない。
俺みたいな無精者でも2000語程度の辞書は作ったし、
わからない単語・熟語は定期的にエクセルにまとめてる。
1も「辞書を作る」なんてぶち上げているんだから、自前の単語帳データぐらい持ってるだろ?
まず、それで「辞書」と呼べるものを作ってからにしなよ。

106 :名無しさん@英語勉強中:04/12/27 20:26:28
英一郎氏は   趣味   でやっているのです

107 :名無しさん@英語勉強中:04/12/27 20:28:15
すばらしい趣味をお持ちですね。

108 :名無しさん@英語勉強中:04/12/27 22:22:59
オントロジーの部分は、話題のセマンティックWebのOWL
と関連している。セマンティックWebでは、いきなり<辞書>
を作るのではなく正しい<辞書>を作るための枠組みに何年も
かけている。特例の領域での辞書は、セマンティックWebの
グループが公開していくから、彼らが公開する資料を利用する
のが賢い選択かも。

<辞書>を自作するのであれば、RDF, OWLに従うべき。


109 :名無しさん@英語勉強中:04/12/27 22:29:07
>>108
そんなことをしなくてもCSVでいい。
アプリからも使いやすいし。


110 :名無しさん@英語勉強中:04/12/27 23:37:38
>>92
>EDRは、9年以上の歳月と180億円を投じたが、
大きな問題点があった。

時間と金はあったが 技術が無かったと。

データベースソフトでは他分野ですごいの知っているが、
それと比べたら辞書データベースは 相当シンプルなんだけど。

やったな!課題が見つかったね!!

111 :名無しさん@英語勉強中:04/12/28 00:39:19
>>1の英語辞書はシソーラスのことだったのか。
英語辞書といえば英英・英和・和英・熟語・シソーラスなどなど…

112 :名無しさん@英語勉強中:04/12/28 10:44:50
>>106
独りでシコシコやってる分にはいちゃもん付ける気は無いけど
人を巻き込んだプロジェクトを進めたいのなら、もうちょっとしっかりしてくれということ。

113 :名無しさん@英語勉強中:04/12/28 10:52:36
>>112
いや、趣味を同じくする人がやっていこうというのでかまわん
と思うんだが。

114 :名無しさん@英語勉強中:04/12/28 11:13:26
高校入試程度の単語でもいいので、
とりあえず「辞書」と呼べるものを一度作ってみてください。
そうしたらどこをどうしたらいいのか、また、どうしたいのか、
具体的に浮かび上がってくると思います。

それと、
>●参照カウンタ
>何回その単語が参照されたか数えます。
>これは非常にマイナーな単語や使わない単語とよく使われる単語を区別するためです。
「よく使われる単語」の意味が良く分かりません。
「よく参照される」の意味ですか?
実際には使用頻度の高い冠詞や人称代名詞なども、辞書で参照される回数はかなり低いと思いますが、
これらも「マイナーな単語」として数えられることになるのですか?

115 :名無しさん@英語勉強中:04/12/28 14:04:27
>>114
1は、プログラムで使うことに重点を置いてるんだろうから、
出現頻度が参照頻度になるって考えてるんだろうな。

どうして、市販の紙の辞書から離れられないのかな。
まあ、そこにしか関心がないってことか。

116 :名無しさん@英語勉強中:04/12/28 23:17:34
結局のとこ、どういう場面での使用を想定した辞書なんですか?
他のプログラムに組み込んで使うのか、
英二郎みたいに紙の辞書と同じような感覚で使うものなのか、
それともその両方を目指してるのか?

117 :名無しさん@英語勉強中:04/12/29 01:22:11
>>110
ミニロケット開発失敗した模様

118 :名無しさん@英語勉強中:04/12/29 01:46:20
>>115=>>1
自分で洋書で使われる単語の出現回数調べろ。
もっとも実用レヴェルの辞書データが存在するからいらない気もするんだが...
それに達する前に既に方向性見失って頓挫しているこのプロジェクトの存在自体無意味。
考えもまとまらないうちにわざわざここに持ってくるな。

119 :名無しさん@英語勉強中:04/12/29 03:13:09
>>118
出現回数数えろ?w
馬鹿かこいつ。少しは時代についてこいよ。
ウザイから消えろ。

120 ::04/12/29 11:31:40
まー私は何にしたって、説明不足で意味不明といわれるんだが、
それでも理解できる人がいるのは確か。
なんと言われようが突き進みます。

理解できないんだか理解しようとしないのかは人それぞれだけど
プロジェクトの進行が理解できない人 105 112
今回作ろうとする辞書が理解できない人 108 116 118
辞書のフォーマットが理解できない人
がいる中で
それらを理解してさらに先へと導いてくれる人
101 102 111 115
理解しようと努力してくれている人
114
もいます。
分からんなら書き込むなとは言わないけど、もうちょっとがんばって考えてみてくれYO-
どんなことにも少なからずメリットはあるはずなんだから。

>>114
「よく使われる単語」の意味が良く分かりません。
パソコンでの使用を考えると、検索に使われた回数、例文に用いられた回数を数えることは簡単にできます。
またある単語を調べた際、意味が色々羅列されるわけですが、その中で自分の目的とする訳語というのは通常一つです。その訳語というのは全平均を取れば大体頻出訳語となります。
そういった、使いやすさを反映させるためのパラメータだと思ってください。
だからメジャーな単語で誰もが意味を知ってて検索にめったにかけられないような単語は逆にマイナー扱いを受ける可能性もありますが、それはそれで構わないと考えています。
ここで言うよく使われるとは”よく調べられる”ということなのですから。

121 ::04/12/29 11:36:55
もちろん、頭良すぎててめーの下らん辞書プロジェクトなんか腐っちまえという奴もいるんだろーけど。
できたらそういう人は、下らんで片付けないで、どういうところが下らないかを教えてくれたり、
こうしたらもっと面白くなるんじゃねーの?と助言を付加してくれると助かります。

122 :名無しさん@英語勉強中:04/12/29 13:19:00
1950'sの著作権切れの辞書をそのまま使おうとするプロジェクトは、
どっかにあったと思ったが...

123 :英一郎:04/12/29 14:12:57
>>108
今回作ろうとする辞書が理解できない人 >>108
↑私が馬鹿でした…
ちゃんと確認しないで書いてしまった。ごめんなさい。


124 :英一郎:04/12/29 14:47:02
EDRのプロジェクトが一番思い描いているものに近いんだけど
http://www.iijnet.or.jp/edr/J_index.html?
↑のリンクちゃんと管理されてんのかyo-
http://www.iijnet.or.jp/edr/EDR_J02a.doc
に何とか行き着いたんだけどどーやって全部みるのさ?
EDRは結構知ってる人が多いみたいだけど、素人が調べるときはどうしたらいいんですか?
それとEPWING
http://www.epwing.or.jp/
ってフォーマット公開してないの??
あーまたダークなエネルギーが溜まってゆく…
なんか日本語のサイトってかなり閉鎖的なのが多いっすね…


125 :名無しさん@英語勉強中:04/12/29 15:02:37
英語はいい 格段に世界が広がる
海外サイトへGO

126 :名無しさん@英語勉強中:04/12/29 15:14:11
プログラム云々の部分は知識がないから付いていけないけど、
これまで紙の辞書ではどんな試みがなされてきたかの文献ならあります。
当たり前ですけど英語辞書の部分が一番詳しいです。
特に「和英辞典」の項がいいかも。
参考になれば幸いですが・・・

竹林・千野・東(編)『世界の辞書』研究社 1992

127 :名無しさん@英語勉強中:04/12/30 03:08:04
>>124
http://www.moji.gr.jp/bib/jis.htmlのJIS X 4081:2002が
Epwing v1.0と互換性があるみたいです。
freePWINGというソフトを使えば、JIS X 4081 形式の
データを生成できます。

128 :名無しさん@英語勉強中:04/12/30 03:20:02
>>124 EDR
http://www2.nict.go.jp/kk/e416/EDR/J_index.html?
に入手方法がかかれているのを発見しました。

129 :名無しさん@英語勉強中:04/12/30 03:26:02
日本語形態素解析システム JUMAN
http://www.kc.t.u-tokyo.ac.jp/nl-resource/juman.html
はEDRを内蔵しているそうです。
http://homepage2.nifty.com/baba_hajime/free-dic/)

130 :名無しさん@英語勉強中:04/12/30 03:26:59
前途多難ですが、いい辞書を作ってください。よい年を。

131 :名無しさん@英語勉強中:04/12/30 04:18:05
>>129
JUMANが使ってるのはEDRの日本語辞書の方だよ。
EDR辞書は日本語、英和、概念体系、コーパスなど色々分かれてる。

フリーの英和辞書なら「単語力」のサイトで公開しているやつを
使ってみてはどうか? 8000語あるし、当面はこれでいいだろ。
http://www.tangoriki.com/help.php?id=2

132 :英一郎:04/12/30 12:56:08
>>126 図書館閉鎖ー 年明けにでも勉強させていただきます。
>>128-131 情報アリス
            スポポポポポポーン!!!
      。     。
        。  。 。 。 ゚
       。  。゚。゜。 ゚。 。
      /  // / /
     ( Д ) Д)Д)) <EDR高すぎー
やっぱり色々考えると日本語をどのようにデータベース化しているかとか
EDRの不便な点や矛盾なんかがあったら参考にしたいと考えていたんですが、
とてもさわれそうなものじゃ無いっすね。うちの図書館にも置いてないみたいだし。
そんな一般人の触れられないところに置いておくようなものなのか?
アフォー!
EDRをデータ抽出に使おうとは思ってません、てかできたらいいけど権利的に無理でしょ。
単語収集はまだまだ先ッス。

>>127
おおおっサンクス
JIS X 4081を早速っと…1,890円かいな…
まぁ買えない金額じゃないけど不便じゃのぅ PDFなんかもろ公開されてんのになー
freePWINGがオープンソースなのは助かりました。読めるかどうか分かりませんが…
PDICの作者もこれ参考にしたのかな?
このフォーマットに下位互換が取れたらと思ってるので、一応知っておきたかったのです。

133 :名無しさん@英語勉強中:04/12/30 22:26:02
>>132
>EDRの不便な点や矛盾なんかがあったら参考にしたいと考えていたんですが、
>とてもさわれそうなものじゃ無いっすね。うちの図書館にも置いてないみたいだし。
多くの大学では、サイト・ライセンスを購入しているから、
無料で使える。情報関係の教員に相談しなさい。

134 :名無しさん@英語勉強中:04/12/31 02:26:50
( ´∀`)やっとるね

135 :名無しさん@英語勉強中:04/12/31 23:33:07
>>1、これも入れろよ。

Methionylglutaminylarginyltyrosylglutamylserylleucylphenylalany-
lalanylglutaminylleucyllysylglutamylarginyllysylglutamylglycyla-
lanylphenylalanylvalylprolylphenylalanylvalylthreonylleucylglyc-
ylaspartylprolylglycylisoleucylglutamylglutaminylserylleucyllys-
ylisoleucylaspartylthreonylleucylisoleucylglutamylalanylglycyla-
lanylaspartylalanylleucylglutamylleucylglycylisoleucylprolylphe-
nylalanylserylaspartylprolylleucelalanylaspartylglycylprolylthr-
eonylisoleucylglutamiylasparaginylalanylthreonylleucylarginylal-
anylphenylalanylalanylalanylglycylvalylthreonylprolylalanylglut-
aminylcysteinylphenylalanylglutamylmethionylleucyalanylleucylis-
oleucylarginylglutaminyllysylhistidylprolylthreonylisoleucylpro-
lylisoleucylglycylleucylleucylmethionyltyrosylalanylasparaginyl-
leucylvalylphenylalanylasparaginyllysylglycylisoleucylaspartylg-
lutamylphenylalanyltyrosylalanylglutaminylcysteinylglutamyllysy-

136 :名無しさん@英語勉強中:04/12/31 23:34:14
lvalylglycylvalylaspartylserylvalylleucylvalylalanylaspartylval-
ylprolylvalylglutaminylglutamylserylalanylprolylphenylalanylarg-
inylglutaminylalanylalanylleucylarginylhistidylasparaginylvalyl-
alanylprolylisoleucylphenylalanylisoleucylcysteinylprolylprolyl-
aspartylalanylaspartylaspartylaspartylleucylleucylarginylglutam-
inylisoleucylalanylseryltyrosylglycylarginylglycyltyrosylthreon-
yltyrosylleucylleucylserylarginylalanylglycylvalylthreonylglycy-
laranylglutamylasparaginylarginylanylalanylleucylprolylleucylas-
paaginylhistidylleucylvalylalanyllysylleucyllysylglutamyltyrosy-
lasparaginylalanylalanylprolylprolylleucylglutaminylglycylpheny-
lalanylglycylisoleucylserylalanylprolylaspartylglutaminylvalyll-
ysylalanylalanylisoleucylaspartylalanylglycylalanylalanylglycyl-
alanylisoleucylserylglycylserylalanylisoleucylbalyllysylisoleuc-
ylisoleucylglutamylglutaminylhistidylasparaginylisoleucylglutam-
ylprolylglutamyllysylmethionylleucylalanylalanylleucyllysylvaly-
lphenylalanylvalylglutaminylprolylmethionyllysylalanylalanylthr-
eonylarginylserine

137 :名無しさん@英語勉強中:05/01/01 10:14:58
>>135
発音記号付けてくれたらね

138 :名無しさん@英語勉強中:05/01/01 12:26:45
what??
HE

139 :名無しさん@英語勉強中:05/01/01 12:27:50
HE WANNA MAKE AN ENGLISH DICTIONARY, DOESNT HE?

140 :名無しさん@英語勉強中:05/01/01 12:40:31
>>131
>JUMANが使ってるのはEDRの日本語辞書の方だよ。
いずれにしても、EDRを利用してフリーソフト(=juman)が公開
できるという先例があるので、サイトライセンスを取得している
大学でとりあえずEDRを利用して、<フリーソフト>を公開して
みては?

141 :名無しさん@英語勉強中:05/01/01 19:31:19
とりあえずまともじゃないことは確かだなw
自演乙。

142 :名無しさん@英語勉強中:05/01/02 13:51:30
w←これってムカつくな

143 :英一郎:05/01/03 01:07:15
あけおめ(あけおめ)俗

あけましておめでとうございます。
意味:新年の挨拶、1月1日から4日までの間、人と会った際に一度目にのみ交わす挨拶。
ただし、昨年親族が亡くなった相手にはこの挨拶は行なってはいけない。

っていうかさぁ…正月2日になっても年賀状一通も来ないんですけど…
10通も出したのになぁー。郵便配達員に捨てられたことにしておこう。

>>135
それ、最長の英単語とかいうやつですね。
単語の登録は半角で256文字までにします。
理由は扱いやすいからです。全角にして128文字以上の単語なんて通常考えられないですし。
256文字以上にすると検索とかパソコンのパフォーマンスが悪くなるんです。
例外的なのは例外として扱うようにしますけど、まだまだそれ以前の状況ですからね…

>>140
EDRについても正月明けないと何もできないっす。

1月中旬に向けていよいよ忙しくなってきたので、しばらくは何も進展できません。
今年はまったりよろしくお願いします。

144 :名無しさん@英語勉強中:05/01/04 03:53:20
>>1へ。
プログラム板に言った方がいい。
このスレのログ読んでみたけど自己顕示欲の固まりの見当違いの痛いレスが大杉。
辞書とか言うからこういう変なのがふんぞり返って出てくるんじゃないの?
単語データベースって言えば?オブジェクト指向の単語データベースを設計したいんでしょ?
まあ、粗野なレスを物ともせずにぬっぽり突き進んで行くあなたのような人には好感が持てます。
専門外ですから特に何も出来ませんが陰ながら応援してますよ。
がんばってね。

145 :名無しさん@英語勉強中:05/01/04 17:25:32
たしかに ストレッサーが多いよな 笑

146 :名無しさん@英語勉強中:05/01/07 11:51:33
英和のテキストデータなら2種類持ってますが何か?

147 :名無しさん@英語勉強中:05/01/07 18:44:39
それがフリーで公開されているかということが一番このスレでは重要なのでは?
あるいは、辞書を作るという知的好奇心であるとか。

148 :名無しさん@英語勉強中:05/01/07 22:14:37
知的好奇心ならいいや。
でもそのうち1つはフリーなんだな。4万語しか入ってないけど。

149 :英一郎:05/01/08 00:42:19
ちわー。
>>146
すばらしい辞書をお持ちで。
もし、協力していただけるのであれば、形あるものが出来上がった時にでも、データを公開していただけると助かります。

>>144
もともとプログラム・マ版には常駐してます・・・
プログラムの技術的なことはどちらかといいますと得意な方なので、
私にとっては辞書の仕様(作り方)の方が無知なわけです。

私の方は18日から本格的に動けそうです。
それまではとっても手も付けられない状況です。


150 :名無しさん@英語勉強中:05/01/08 01:16:15
TIME、Newsweek、washingtonpost、Reader's Digest、National Geographicを読め


151 :名無しさん@英語勉強中:05/01/08 03:50:43
>>150
なぜNatureが無いのかが気になる

152 :名無しさん@英語勉強中:05/01/08 08:02:06
よっぽど科学的な単語が必要ならry

153 :名無しさん@英語勉強中:05/01/08 21:06:03
1が逃亡してなくて一安心。

154 :名無しさん@英語勉強中:05/01/12 15:25:48
>>1さんへ

辞書を作成しようと考えていたらこのスレッドを発見しました。
とても参考になります。同時期に同じ事を考えていた人が居たと
いう事も、少し嬉しく思います。
私も辞書を作るといった点で知識が乏しく、苦労しています。

残念ながら、私は全てフリーでやっていく予定では無いのですが
成果物の一部はフリーにしようかと考えています。
もし成果があがれば、その成果物のフリーの部分は
こちらでデータを公開させていただくかもしれません。

このスレッドを作ってくれた1さんへ、お礼が言いたく書き込みしました。
ありがとう。そして、お互い頑張りましょう。

155 :英一郎:05/01/12 15:37:42

































156 :英一郎:05/01/12 23:21:47
ちわ。
誰かWordNetの辞書データの内容を日本語で解説できる人いますか?
ぱっと見たところプレーンテキストで
ID-単語-リンク-意味
の順で並んでるのですが、リンクのところの特殊文字が何を意味するのか知りたいっす。
だれもいなけりゃ自分で調べますが、誰か知ってたら教えて欲しいな…とおもっただけです。

>>154
本格始動まもうちょい先ですが、お互いがんばりましょ。

157 :名無しさん@英語勉強中:05/01/12 23:50:02
英語辞書=シソーラス?馬鹿か。
自分主導でやるプロジェクトにここを使うな。まずサイトでも立ち上げてから話しろ。


158 :名無しさん@英語勉強中:05/01/14 09:05:06
あいかわらず、無知な英語厨がわいてでますな。

159 :名無しさん@英語勉強中:05/01/14 21:31:09
>>156
>誰かWordNetの辞書データの内容
XML版をダウンロードすれば、意味が分かるよ。

160 :名無しさん@英語勉強中:05/01/14 22:44:56
ちみたち英語辞書作る前にまず大学の英語関連の学科に逝きなさい。

161 :英一郎:05/01/19 00:05:07
どかーん!
(⌒⌒⌒)
 ||

/ ̄ ̄ ̄ ̄ ̄\
| ・ U      |
| |ι        |つ
U||  ̄ ̄ ||

はじめるゾウ!
ちょっとまってねー


162 :名無しさん@英語勉強中:05/01/19 17:13:03
http://hp8.0zero.jp/118/translate/

163 :英一郎:05/01/20 01:41:30
>>162
Webマスターの方ですか?

164 :英一郎:05/01/27 00:35:14
定期age
データベース仕様は大体完成
サーバーの構築に手間取ってます。
Windowsベースで構築してたんですが、いろいろ凝ったこと無料でしようとすると結構難しくて…
再配布まで考えるとライセンスフリーも重要なので
Apache + php + MySQLでいろいろ試行錯誤してます。
ぜーんぶ初挑戦だから入門書あさってますよ。
本代だけでも結構お金かかってるな…

165 :名無しさん@英語勉強中:05/01/27 11:29:49
>>164
がんばれ!!

166 :あぼーん:あぼーん
あぼーん

167 :S:05/02/04 10:28:13
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●合格●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
これを見た人は【合格】します。これをコピペでどこかに3回貼れば確実です。
これは本当です。やらないと一年無駄になります.

私も最初は嘘だと思ったんですが、東大、東工大院落ちたんで一応コピペしてみました。
そしたらJAISTに合格出来ました。
けどコピペしなかった友達は、A8割とっていたのに、おちたんです

168 :名無しさん@英語勉強中:05/02/06 15:19:31
      (  ヽ      ――――  ○  ――――
     , ⌒ヽ    (     )          // | \
    (    '   (       ヽ⌒ヽ 、   / / |    \
    ゝ    `ヽ(              )        | (⌒ 、
   (            ⌒         ヽ     (     ヽ がんばりーや
           ∧__,,∧   がんばってね      ((( )))
____________________( ´・ω・) ______________________________ ( ´∀`) ____________________________
          (  つ(\               (  つ(\
       (\_ノ(___)⌒ ⌒ヽ_          (\_ノ(___)⌒ ⌒ヽ_
       ) ____  ・_つ        ) ____  ・_つ
      (/      (/          (/      (/
    。 ゚                  。 ゚
   。 ゚                  。 ゚
 〜〜〜〜              〜〜〜〜
〜〜  〜〜  〜〜  〜〜  〜〜  〜〜  〜〜  〜〜  〜 〜〜 〜
   〜〜  〜〜  〜   〜〜  〜〜  〜  〜〜  〜〜  〜 〜〜
〜〜 〜〜  〜〜〜  〜〜    〜〜〜  〜〜 〜〜 〜 〜〜  〜〜


169 :英一郎:05/02/07 03:29:36
    ∧∧
   (=゚ω゚)ノ ぃょぅ
 〜(  x)
   U U

もーちっとでプレリリースできそうです。
2、3月は暇なはずなのに、なぜか日曜まで狩り出されてます…
にしてもPHPって良いですな。MySQLもサイコー。
CSSもスゲーぇぇぇ。
ネットの進歩は凄まじいですな。
2週間みれば初披露まで漕ぎつけそうです。

>166
情報ありです。
この本は立ち読みしたような…でも買わなかったッス。
もういっぺん本屋いってきます。

>168
予想以上に遅い進行ですが、飽きないで (w


170 :166:05/02/08 15:44:41
当たり前に思われるかもしれませんが、作ってる時はおろそかに
なりがちなバックアップを、初期の段階からとっておく事をお勧め
します。多重に。

1.DBのバックアップ
[MySQL]
http://tsuttayo.sytes.net/mysql/backup/
[PostgreSQL]
http://wiz.syscon.co.jp/BackupDbLinux.html

2.サーバー設定ファイル郡
(linuxであれば[tar etc.tgz ./etc]ですが、windowsなので手動で。。)

3.HDDイメージの取得(SystemRescueCD Freeです)
[DownloadPage]
http://www.sysresccd.org/
[使い方]
http://acorn.zive.net/~oyaji/backup/partimage.htm

4.お金があればRAID1ミラーリング

既にサーバー構築を幾度かなさっていて、バックアップ経験が
あれば、余計なお世話ですのでごめんなさい。

171 :EX:05/02/13 16:35:28
なんかおもしろうそうな事やってますな〜

英語辞書を探してたら行きついたんでw



172 :EX:05/02/13 16:37:17
JSPで作るの?

173 :EX:05/02/13 16:38:57
ごめPHPって書いてあった(汗

174 :名無しさん@英語勉強中:05/02/13 20:50:27
システムの開発は、それなりに面白いが、データ入力は、はっきり言って
肉体労働。ネットでボランティアを集めて、無料奉仕させるには、
何か工夫が必要だろう。

エイジロウは、1文字数銭で、単語入力者に金を支払っている。
大学研究機関は、科研費などで大学生に金を払っている。

名も無い個人が、ボランティアに無料奉仕させるのには、どう
すればよいか?! ここが最大のボトルネック。

175 :EX:05/02/14 03:10:52
クライアントに広告を乗せて、
そのマージンで稼いだ金とかを充当するってのは。。。
それじゃぁ、後払いだし、幾ら入るかも分からないから駄目かなw

176 :名無しさん@英語勉強中:05/02/14 13:54:38
170です。

>>174
まずはサイトを早く立ち上げる事です。
96で1さんが出してるURLを、テキストのみでも良いので
作ります。そこでオープンソースに興味のある方々へ
呼びかける事が第一歩だと思います。

>>1さんへ
96のURLへmailaddressの一つでも載せてください。
力不足ではありますが協力させていただきます。
(英語力が皆無なのでお力になれないかもしれません。。汗)

177 :名無しさん@英語勉強中:05/02/14 23:35:07
青空文庫に辞書ってないね。

178 :英一郎:05/02/15 02:59:42
ぐそぉぉ
この3連休が肝だったのに風引きました…
で4連休になったのですが、さすがに動けなくて休んだので、パソコンもできませんでした。
雪祭りでウイルスが持ち込まれたのかな…札幌は決まってこの時期、風邪がはやってる気がします。
何とか今週末には弄れるものを用意しますのでスミマセンです。
てか一人身は本当に病気になると辛い!!

>>174
まーたしかに、ボランタリーな人がどれだけいて、サイトに来てくれる人がどれだけいるか、
荒らしがどれだけの比率で現れるかも興味があります。これらは全て公開していく予定です。

179 :英一郎:05/02/15 03:05:10
まだ、実装できてませんが、
入力作業は、
匿名とID有の両方で書き込み可能にするつもりです。
ID保有者は書き込み時にポイントが加算され、
ポイントの高い人間のした書き込みに対してポイントの低い人間は編集を行なえないようにします。
少しでも多くの書き込みをした人に対する優遇措置をすることで、書き込む楽しさを持ってもらえればと思ってます。

てか昨日はバレンタインデーだったのか。
ま、いっか。

180 :名無しさん@英語勉強中:05/02/15 07:34:41
>>174
1文字打てば1〜3円もらえるらしい

181 :名無しさん@英語勉強中:05/02/20 04:08:21
今週末に始動はちょっと難しいかな?

182 :英一郎:05/02/22 23:19:35
http://wwwords.net
でドメイン取得しました。
で、一応「名詞」の単語登録、検索が可能な状況ですが、
なにぶんPHP初挑戦だったため、ソースの書き方造自体に納得がいかず、もう一度作り直す予定です。
Wikiとか最初からみておくべきだったかも…
非常に素っ気無いつくりですが、見てもらいたい点は、

「日本人」で検索すると「にほんじん」「にっぽんじん」と複数の読みをサポートできる。
「森」…「場所の森」と「姓の森」で英語訳が異なるような単語のサブグループ化ができる。
属性はリンク形式なので、後から幾らでも追加ができる。「牛」で検索してみてください。
たとえば、英語の名詞には複数形の不規則変化型があるがこのような要素を後から追加できる。
日本語だと、数えるときの不規則数詞とか(魚->匹)とか。
等です。
適当に中学生レベルの英語名詞を入れてもヒットするかもしれません。


183 :名無しさん@英語勉強中:05/02/25 21:01:17
wikiみたいに誤謬ありまくりの低レベル辞書にならないことを祈りますが・・

184 :名無しさん@英語勉強中:05/02/26 01:17:37
正確性も大事だけど、レベルの高い辞書なら市販のものがいくらでもあるわけで。
とりあえず誰でも自由に利用できる辞書データが出来ることに意義があるので前向きにいきましょう。
といっても入力してくれる人が集まらないことにはどうにもならなそうだけど。

185 :名無しさん@英語勉強中:05/02/28 01:16:12
http://www.popjisyo.com/
POP辞書
非常に便利!!!!!!!!

186 :名無しさん@英語勉強中:05/03/14 16:43:30
俺が思う事。

1、現代辞書は発音が音声で確認できなければあまり価値はない。
2.複数人で取り組むなら、エキスパートでなければいけない。主催者がエキスパートであることは言うまでもない。
3.上が満たされていなければ、フリー辞書なんて他にいくらでもあるのでやる意義が無いかと思う。

187 :名無しさん@英語勉強中:05/03/14 16:45:12
批判ではなくて、他のフリー辞書を見て感じたことです。

188 :名無しさん@英語勉強中:05/03/14 16:54:45
>>187
フリーの辞書ってそんなにある?
いくつか紹介してくれないかな?

189 :名無しさん@英語勉強中:05/03/14 21:20:25
名詞はともかく、動詞とか形容詞とかは日本語と英語は感覚が違うから
適切な表現を与えるためには例文をいくつか載せる必要もあるね。
例文が無ければ語学学習には役に立たない。。というか訳すのは無理だからね。

190 :名無しさん@英語勉強中:05/03/14 22:27:01
>>184
仏語辞典とか西語辞典とか、まだまだ電子版が高いものならいざ知らず、
英語の場合、英和・和英付で2千円切ってたり、オンラインなら優れた辞書がすでに複数ある。
正確でないなら誰も使わんだろう。


191 :名無しさん@英語勉強中:05/03/14 22:45:11
>>190
プログラマじゃないとこの辺イメージできないのかもしれないけど、
「再利用・再配布可能なデータかそうでないか」
ってのがこのスレでは一番重要なんだよ。

英辞郎二号を作ろうと言う話とはちっと違うと思うよ。

192 :名無しさん@英語勉強中:05/03/17 17:36:22
>186
意味がない、というが、こういう場で辞書を作ろうと試みる事自体
には意味があると思う。著作権フリーである、という目的を掲げて
いる事も意味がある。

193 :名無しさん@英語勉強中:05/03/18 20:16:25
肝心の英一郎氏が最近書き込んでいないけどどんな感じなんだろ

194 :名無しさん@英語勉強中:05/03/18 20:40:01
これはオンライン辞書?それともオフライン(ソフト)辞書かな?
オンラインならこんな感じだと便利で需要があると思います
http://www.m-w.com/
http://encarta.msn.com/encnet/features/dictionary/dictionaryhome.aspx
オフラインではここまで出来たのはフリーで見当たらないですね

195 :名無しさん@英語勉強中:05/03/19 06:54:28
データがあれば、アプリケーションの作り方次第で、オンラインにもオフラインにも
出来ます。

196 :名無しさん@英語勉強中:2005/03/29(火) 19:11:25
                ___
               _/ \  \_
            ((/___))___\))
              | |!!! !!!| | |!!! !!! !!!| |
              | |;;;; ;;;;| | |;;;; ;;;; ;;;;| |
              | |;;;; ;;;;| | |;;;; ;;;; ;;;;| |
  Λロ二二ロ二Λ二Λ二Λ二Λ二二二二Λ二Λ二Λ二Λ二l
  (^×^∩  ∩(´∀` ) (・∀・ )   ∩(ΦλΦ )(ー人ー )
┌〔〔 〔〔V)  ヽ〔〔 〔〔 つ〔〔 〔〔 つ   ヽ〔〔Э〔〔 つ〔〔 〔〔 つ GO!
(_ノ〈 ||_|  (_ノ〈 ||_|(_ノ〈 ||_|    (_ノ〈 ||_|(_ノ〈 ||_|
   (__)     (__)   (__)       (__)   (__)


197 :名無しさん@英語勉強中:2005/03/29(火) 19:41:29
著作権フリーって、GPLの方向?
それとも修正BSDぐらいかパブリックドメインてこと?

皆で必死こいて作った辞書を持ってかれて
ほんのちょっと機能を追加して製品にされたらたまらんよね。
かといって・・・うーん。

198 :名無しさん@英語勉強中:2005/03/30(水) 16:21:46
>197
フリーで公開してれば買う人いないんじゃね?お金を出すだけの付加価値(機能)だったら売れるかもしれんけど。
又は作った辞書データを便利に使えるツールを1500円〜2000円位でダウンロード販売だったら売れるかもだし。
それはそれで盛り上がっていいんじゃないかなー。

199 :名無しさん@英語勉強中:2005/03/30(水) 22:56:50
>198
付加価値が高い場合が往々にしてある。
こちらの辞書が50の分野(or特徴)で傑出していて、
他さまざまなソフトが100ずつの分野(or特徴)で傑出していたとする。

他ソフトはこちらの内容も含めて150の価値を出せる。
対して、こちらは50を100にしようと、200にしようと
いつまでたっても辞書としての優位性は得られ無い。

辞書としてさして優位性が無い(フリーである、という点だけ)のに
加えてこれでは、辞書編纂に加わる人のモチベーションは保てるか?

「この辞書を盛り上げていこう」という機運を高めるためには
これじゃあ駄目だよね。

200 :名無しさん@英語勉強中:2005/03/30(水) 23:54:51
>199
そう?他の辞書の一部としてでも役に立って世の中に貢献するんだったら、フリーの辞書としての意味(の一部でも)を全うしてると思うけどなぁ。
そもそもが金儲けとかが目的なわけじゃないし。

201 :名無しさん@英語勉強中:皇紀2665/04/01(金) 00:12:47
やはりデータ作成は厳しいだろうな。。一生の仕事になるんでは?
データベース部の作成だよね、ここの辞書作成というのは。
データくれ

202 :名無しさん@英語勉強中:皇紀2665/04/01(金) 00:13:47
*データベースのソフト 

203 :名無しさん@英語勉強中:皇紀2665/04/01(金) 00:15:05
なんかタイムスリップしているようだ・・

204 :sage:2005/04/12(火) 15:10:25
断念!

205 :名無しさん@英語勉強中:2005/04/24(日) 11:25:26
残念!

206 :名無しさん@英語勉強中:2005/04/25(月) 21:57:45
再開!

207 :名無しさん@英語勉強中:2005/04/26(火) 02:12:24
ソフトウェアのほうで、発音記号、カタカナ読み、定義、定義の訳、訳例、例文、例文の訳
などの表示の有無や文字色や大きさを使用者がカスタム出来るようにして欲しいです

あとデータベースの仕様を決定したあとですが例文などに書かれている英単語をリンクさせる事は可能でしょうか?

将来AIの言語学習ソフトになるかもしれないというのは夢のある話ですね
応援しています
健康には十分気を付けてほどほどに頑張って下さい

208 :名無しさん@英語勉強中:2005/06/01(水) 20:36:29
>>1さんはいずこ。。。

209 :名無しさん@英語勉強中:2005/06/11(土) 11:20:30
ルールが多いと入力が面倒になるだけだよ
英辞郎とかPDIC形式ぐらいでいいとおもうぞ
それか単語列と意味列だけのCSV形式。

210 :名無しさん@英語勉強中:2005/06/14(火) 08:13:13
アップまだー?

211 :名無しさん@英語勉強中:2005/06/14(火) 09:01:41
言うは易し行うは難し

212 :名無しさん@英語勉強中:2005/06/14(火) 15:29:52
http://www.urbandictionary.com/define.php?term=chonglish&r=f

1. Chonglish
Chonglish is a spoken English by the Korean people with Korean accent.

213 :名無しさん@英語勉強中:2005/06/21(火) 04:29:04
ライセンスはちゃんとGPLかCreativeCommonなんだよな?

214 :名無しさん@英語勉強中:2005/06/21(火) 12:22:24
進行状況を教えてくれ。

215 :名無しさん@英語勉強中:2005/07/20(水) 09:14:33
煽るだけで協力もしない人はいらないよ

216 :名無しさん@英語勉強中:2005/07/20(水) 12:56:45
>>215
お前もな

217 :名無しさん@英語勉強中:2005/07/20(水) 13:53:53
初めて見たけど、面白い試みだね。
ただ、1の考えていることがデータベースの構築か辞書データか
もひとつはっきりしないな。

俺はPSSの問題集作るために、LDOCEをアクセスのデータベースに
変換して使っているので、その手の辞書データの有用性はよくわかる。

また、単語同士のリンクや頻度データなんかをDBでいぢくりまわすのも
これまた面白いだろう。辞書データを作成といっても栄二郎の2番煎じ
なんで、まずは単語DBとして面白いものをフリーのPDIC辞書とか
利用して作成したらどうかな。

218 :名無しさん@英語勉強中:2005/07/20(水) 19:30:42
>>217
>まずは単語DBとして面白いものをフリーのPDIC辞書とか
>利用して作成したらどうかな
誰が作成するの?

219 :217:2005/07/20(水) 22:59:42
もちろん1が。
なんかつくりかけてたやん?

220 :217:2005/07/20(水) 23:04:53
なんか単語を入力したら、
語義だけでなくコロケーションとか関連情報とかが
面白く抽出されて出てくるようなDBだったら、
これまでにない魅力があるし、
辞書データ編纂に協力する人も出てくるんじゃない?

しかし、テキストを食わせて、そういう単語の関連性を抽出する
ソフトの方が先かもな。

221 :名無しさん@英語勉強中:2005/07/21(木) 00:43:42
5ヶ月も英一郎の書き込みねーじゃねえか
のたれ死んだか、遁走したかのどっちかだろう

222 :名無しさん@英語勉強中:2005/08/17(水) 03:37:25


223 : ◆wMzNGLjdrw :2005/08/23(火) 16:25:14
PSS の話題が出ていたので来てみました.
なにやら面白そうなプロジェクトですね.1 さんが最近活動されていないのが
実に残念です.
語学学習ソフトの作者として,本プロジェクトの有意性には同意できます.
辞書についてはずぶの素人ですができることがあれば協力したいのですが.

224 :名無しさん@英語勉強中:2005/08/28(日) 18:49:20
>>211
>言うは易し行うは難し
言うは易し行うは難し

225 :名無しさん@英語勉強中:2005/09/01(木) 21:21:59
>>224
>>言うは易し行うは難し
>言うは易し行うは難し
言うは易し行うは難し

226 :名無しさん@英語勉強中:2005/09/01(木) 21:23:50
日本語ムズすw

227 :名無しさん@英語勉強中:2005/09/09(金) 11:02:26
ウィクショナリー
#GFDLに注意
終了

228 :名無しさん@英語勉強中:2005/09/10(土) 01:15:32
>>3
がいいこと言った。
っつーか、どんなにマイナーな単語でもちゃんとした例文が載ってる辞書
マジでほしい…。つーか、既存の辞書に例文つけてくれただけで俺は買う

229 :名無しさん@英語勉強中:2005/09/10(土) 01:35:38
>>228
辞書である必要はなく、みんな検索エンジンはあるんだから、結局は、
膨大なコーパスがあればいいんだよな。ぐぐって出てくるのがかなら
ずしも、正しい英語とはかぎらん状況だと、マトモっていうコーパスが
どっさりあれば、あとは、検索で、必要な文章がでてくれば、前後の
文脈から、例文としては使いやすいものになるのではないか、と思う
がいかがかな。

230 :名無しさん@英語勉強中:2005/09/10(土) 01:50:28
そう、コーパスがいい。
日本人はコロケーションに弱い(論理的にはありえても絶対に使わない英文を作り上げる)から。
ただしそうなると、著作権の問題山積。

231 :名無しさん@英語勉強中:2005/09/10(土) 02:19:44
>>230
そうなんだよなー。それをクリアしようとすると、古い英文ばっか。
もっとも、WEBで、というなら、リンク集みたいな感じで、比較的
内容が固定していて、良い英文でかかれているサイトのリンク集をつくり、
ついでに、そのリンク集の中に検索ができるようなエンジンがあれば
単語一発で、優良な文章がざくざく出てくるようなシステムがつくれ
るのではないだろうか?


232 :名無しさん@英語勉強中:2005/09/10(土) 12:16:30
文単位で、英文と日本語訳が対になった英日対訳コーパス
(2億語)があると便利。意味がわからない英文があれば、
コーパスを英語から検索して、対訳を確認することができる。

英語を書く時に、英和辞書で見つからない表現を、コーパスを
日本語から検索、して、英語を確認できる。

233 :名無しさん@そうだ選挙に行こう:2005/09/10(土) 21:50:14
辞書そのものを作るよりもweb上から正しい英語を探し出してくるシステム考える方がうまくいくかもね。
webで手に入って古くなくて著作権に問題ない正しい英文。
なんか思い付く?

234 :名無しさん@そうだ選挙に行こう:2005/09/10(土) 22:04:49
WordNet

235 :名無しさん@そうだ選挙に行こう:2005/09/11(日) 15:41:09
>>234
嘘言わないの・・・
信じる馬鹿がいたらどうするんだろう・・・

236 :名無しさん@英語勉強中:2005/09/12(月) 16:11:53
コーパス、コーパスってお題目みたいに叫んでるけど、
みんなコーパスって何のことを言ってるの?

ここで語られているコーパスの定義をお聞かせ願いたい。

NHKのコーパス君の活躍?でコーパスとはありもしない魔法のリソースかなんかだという
勘違いが広まっているのではないのかと、コーパス言語学をかじったことのある俺は憂う。

237 :名無しさん@英語勉強中:2005/09/16(金) 11:33:47
>>236
NHKのもコーパスといっていいのでは?
何をこだわってるか知らんが
荒らすのやめないか?


238 :名無しさん@英語勉強中:2005/09/16(金) 12:34:01
>>237
どうでもいいが、236のどこが荒らしなんだ?

239 :名無しさん@英語勉強中:2005/09/16(金) 13:22:09
>>238
痛いところを突かれたり、自分に答えられない質問されると嵐だといってごまかす厨房の典型だよ。

240 :名無しさん@英語勉強中:2005/09/19(月) 08:42:56
>236
俺は、単純に出る順と思ってるけど?
より正しい定義があるなら、教えて

241 :名無しさん@英語勉強中:2005/09/20(火) 12:44:28
出る順がダメな理由がわからない
他に有効なものはあるだろうけど
何もしないよりはコーパス使ってのほうがいいとおもうんだけど・・・


242 :名無しさん@英語勉強中:2005/09/21(水) 00:02:26
>>241
微妙に違わないか?
単に、データの集まりを、単語ごとにどれだけ使われているか?
とか、どういう文脈で使われているか?とか、どの意味で使われているか?
な研究に使う奴。
いや、之も微妙にちがうなぁ。

コーパス
出典: フリー百科事典『ウィキペディア(Wikipedia)』
コーパス(corpus; 「身体」を意味するラテン語に由来)とは、電子化された自然言語の文章から成る巨大なテキストデータである。 言語学や自然言語処理などの研究に使うため、言語的な情報(品詞、統語構造など)が付与されていることが多い。
な意味らしいが、

243 :名無しさん@英語勉強中:2005/09/23(金) 20:57:23
和英だったら、フリーな辞書作る意味も大いにあると思うんだが。
英辞郎の和英はあんまり使えないし、実質まともなフリー辞書は存在しない状況だと言っていいと思う。
英和だと、よっぽどいいものか、従来の辞書の概念を変えるような方向性の違いを打ち出さない限り、英辞郎に負けるんじゃない?
再配布をフリーにすることが主な目的なら別だが。

244 :名無しさん@英語勉強中:2005/09/29(木) 01:55:07
>>243
君の発言もただ英辞郎の和英をおとしめたいだけにしか見えないぞ
ただ使えないというんじゃなくて理由を書いた方がいいですよ


245 :名無しさん@英語勉強中:2005/10/05(水) 07:09:07
>>232
日英対応付けコーパスの検索
http://www.kotonoba.net/~snj/cgi-bin/text-search/text-search.cgi

246 :名無しさん@英語勉強中:2005/10/15(土) 00:37:57
質問: 「祝 英辞郎」のスレは、どこへ
消えた?

247 :名無しさん@英語勉強中:2005/10/18(火) 05:35:26
>>246
それくらい自分で探せないか?


248 :名無しさん@英語勉強中:2005/12/04(日) 12:18:41
さがせませんでした。教えてください。
消えた理由も。

249 :246:2005/12/11(日) 17:15:42
248は私ではありません

250 :名無しさん@英語勉強中:2006/01/24(火) 01:06:38
早く教えてください

251 :名無しさん@英語勉強中:2006/01/24(火) 16:39:48
英一郎は今なにやってるの

252 :名無しさん@英語勉強中:2006/02/12(日) 09:48:05
http://www.alc.co.jp/から

検索文字列 : 有言不実行
該当件数 : 4

有言不実行
credibility gap
有言不実行である
be all gong and no dinner // be all mouth and trousers〈英話〉 // be all talk and no action
有言不実行の人は何も生み出さない。
A person of words and not of deeds is like a garden full of weeds.


253 :名無しさん@英語勉強中:2006/02/13(月) 10:41:20
>>252
スレ違い

254 :名無しさん@英語勉強中:2006/03/12(日) 22:25:02


255 :名無しさん@英語勉強中:2006/03/12(日) 22:26:07
関係ないけれど、日本語の話をすると、
院は卒業とはいわん。修了という。院生が学位取らずに院から去るのは、
「退学」だ。必要単位そろえて「退学」した場合は、その後の努力で、
修了することもできる。この場合は「単位取得退学」という。
これは日本語の話な。
オレも、MBAじゃないけれど、工学博士をとったときは、3年院生やって
単位取得退学して、その後、学位取得で「修了」となった。
まあ、?ちゃんでもどこでもそうだろうが、


256 :名無しさん@英語勉強中:2006/03/12(日) 22:26:34
カーネギーメロン大学だかにあったような・・・<フリーな辞書

257 :名無しさん@英語勉強中:2006/04/22(土) 15:02:28
ハゲ

258 :名無しさん@英語勉強中:2006/05/06(土) 17:41:41
もげ

259 :名無しさん@英語勉強中:2006/05/14(日) 19:41:31
ブッ

260 :名無しさん@英語勉強中:2006/05/19(金) 23:36:35
まだ?

261 :名無しさん@英語勉強中:2006/06/20(火) 19:44:53


262 :名無しさん@英語勉強中:2006/07/31(月) 23:04:30
age

263 :名無しさん@英語勉強中:2006/09/09(土) 00:11:11
h ayaku

264 :名無しさん@英語勉強中:2006/09/09(土) 10:52:08
やる気あるの?

265 :名無しさん@英語勉強中:2006/09/24(日) 21:16:56
諦めたのかな?

266 :名無しさん@英語勉強中:2006/10/25(水) 23:38:54
嘘つき?!

267 :名無しさん@英語勉強中:2006/10/27(金) 03:19:12
Do we still look forward to his acheevements?

268 :名無しさん@英語勉強中:2006/10/27(金) 19:54:41
責任者を出せ!

269 :名無しさん@英語勉強中:2006/11/19(日) 13:29:52
いいかげんにしろ!

270 :名無しさん@英語勉強中:2006/11/19(日) 17:28:35
レンタルのwikiでよければ容量無制限のところがあるから借りてくれば?

271 :名無しさん@英語勉強中:2006/11/26(日) 12:24:44
有言不実行は誰にでもあること。許してやれば?

272 :名無しさん@英語勉強中:2007/01/08(月) 20:58:35
まだ続けてますか? URLは?

273 :名無しさん@英語勉強中:2007/01/08(月) 21:43:13
面白そうなプロジェクトだと思って、>>1から順に携帯でスレ読んじまった。
年、変わってんじゃねぇかっ!

gc
lud20190725081937
このスレへの固定リンク: http://5chb.net/r/english/1103041795/
ヒント:5chスレのurlに http://xxxx.5chb.net/xxxx のようにbを入れるだけでここでスレ保存、閲覧できます。

TOPへ TOPへ  
このエントリをはてなブックマークに追加現在登録者数177 ブックマークへ



全掲示板一覧 この掲示板へ 人気スレ | >50 >100 >200 >300 >500 >1000枚 新着画像

 ↓「完全著作権フリーな英語辞書つくりませんか?」を見た人も見ています:
【紙】【電子】英語辞書総合【ネット】【PC】
小1女子が英検2級合格。「辞書なしで英語の本を読みまくった」
ケンモメンなら学生時代の英語は「アルク」で乗り越えたよな 辞書界のブレイクスルーだろあれ
【著作権フリーじゃねえから】くまモン「うれしかモーン」 バレンタインプレゼントに感激
GTA Vは完全に英語の世界に没頭できる神ゲー
英語上達完全マップで勉強してる奴集合 part55
英語上達完全マップで勉強してる奴集合 part39
英語上達完全マップで勉強してる奴集合 part53
英語上達完全マップで勉強してる奴集合 part52
PS4スカイリムはmodを入れると英語になる不完全版対策はmod入れない事 [無断転載禁止]
ジャップ教育、完全な無駄だった。宿題をやらず国語も英語も0点ばかりだった子がその後ノーベル賞に輝く。
モリッシーさん、完全に壊れる 「ロンドン市長は英語をまともに話せない!ハラル認証はイスラム国の陰謀!ヒトラーはパヨクだった!」
【言語フリー】AI翻訳で全社員に「英語(外国語)禁止令」を出した企業、社員の多くは狂喜乱舞 [ばーど★]
安倍フリーになるために英語を勉強し始めた 今TOEIC500点 将来はニューヨークに住むつもりだ
【悲報】マーティ・フリードマン、英語被れになったベビメタに「日本語で歌ったほうがいい」 [無断転載禁止]
著作権クリア合法引用
著作権使用料【対JASRAC対策】
ネプテューヌが著作権違反
特許・商標・著作権問題スレ
徹底批判!なぜ受験英語は語源を教えるのか?
1ヶ月で英語話せるようになるなんてありえるか?
楽天の英語公用語化はなぜ失敗したのか?
なぜ英語話者はかな文字すら覚えないのか?
なぜ英語教師は日本語しかできないのか? Part15
英検準1級とMarchの英語はどっちが難しいか?
何故こうも嘘の英語勉強法が浸透拡散しているのか?
そもそも国語力がないのに英語力がつくわけない件 (489)
英語は簡単
スマホにお勧めの辞書アプリ
SII電子辞書DAYFILER総合スレ 3台目
スマホの辞書appやサイトは何使ってる?
SII電子辞書DAYFILER総合スレ 3台目
英語の疑問
英語の質問
英語と発音
英語の尻取り
大坂なおみの英語
18世紀の英語
内藤哲也の英語術
おとなの基礎英語 7
英語喉を語るスレ5
英語の書き方
英語なんて言葉なんだ
イギリス英語3
イギリス英語4
しごとの基礎英語 4
英語の発音で質問
スマホで英語学習
和製英語は幼児語
英語史スレッド
英語翻訳お願いします
英語教員になる方法
サッポロ英語村
英語で会話するスレ
英語でリレー小説
洋書を読んで英語の勉強41
英語の勉強の仕方1
映画やドラマの英語
英語を英語のまま理解する2
大学生英語を勉強する
英語初心者BOTのスレ
TOEIC700点代の英語力
YouTubeで英語学習
日本語→英語スレ 395
寺沢拓敬の英語教育史スレ
07:55:13 up 46 days, 8:58, 0 users, load average: 9.53, 12.90, 11.42

in 0.024200916290283 sec @0.024200916290283@0b7 on 022821