如何获得英语单词数据库?

我需要一个数据库的每一个有效的英语单词。我检查了 /usr/share/dict/words文件,它包含不到10万字。维基百科说英语有475000个单词。我从哪里得到完整的列表(美式拼写) ?

还有,是否有一个单一的网站也提供其他语言的单词,包括亚洲和欧洲的单词?

编辑: 忘了加,我不需要名字等,只要有效的英文单词。

186170 次浏览

你可以在 Infochimps.org上找到你需要的东西。

他们有一个350,000个简单(即非复合)单词的列表可供免费下载。

单词表-350,000 + 简单英语单词

关于其他语言,您可能想在维基词典上查看一下。这里有一个链接到所有的 数据库备份-的信息不太可能组织,但如果他们有一种语言,你可以下载 SQL 格式的数据。

你没说你要这份名单做什么。如果用作密码检查黑名单的东西足够了,那么 Cracklib可能对您有好处。它包含超过1.5 M 的单词。

WordNet 数据库可能会有帮助。我曾经开发过一个 Firefox 插件,它可以处理单词以及单词和其他东西之间的各种简单到复杂的关联。看起来 WordNet 对你非常有用。

这个(web 存档链接)使用 Wordnet v3.0数据,而不是旧的 Wordnet 2.0数据。

没有所谓的“完整”清单。不同的人有不同的测量方法——例如,他们可能包括俚语、新词、多词短语、冒犯性词汇、外来词、动词变化等等。有些人甚至数过 千言万语!所以你必须决定你想要什么样的单词列表。

你可以查看 Mozilla、 OpenOffice 和许多其他软件使用的 *spell 英汉词典

我没有看到 http://wordlist.sourceforge.net/在这里提到,但这是我将开始如果我正在寻找这样的东西(我是,当我绊倒了这个问题)。

如果你不能在那里找到你想要的,而你想要的是一个英语单词的列表,那么你可能应该花一些额外的时间来描述如何识别你想要的是什么。