本研究ではクラスタリングを利用して動詞の類義語を獲得する方法について検討している.先行研究において,同時に2つの要素のクラスタを考慮しながらクラスタリングする同時共起クラスタリングを適用して,ベクトルベースのクラスタリングより精度が高いことを示した.しかし,近年ベクトルベースのクラスタリングでKernel K-meansという非線形境界でクラスタリングするより高度な手法が提案された.そこで,本報告ではKernel K-means法を我々の動詞類語獲得に適用し,先行研究における同じデータで同時共起クラスタリングとの比較を行う.この結果からKernel K-meansでのグラフ-ベクトルの等価性には限界があり,本研究が利用する2部グラフの構造は直接反映できないこと,先行研究の同時共起クラスタリングの方が高い精度で類語を獲得できることを報告する.This manuscript describes evaluation results of Kernel K-means clustering approach comparing with modified Aizawa's co-clustering approach for verb synonym extraction task. Kernel K-means approach is one of the state-of-the-art vector-based clustering method which can divide vector-spaces with non-linear boundary by incorporating Kernel method. Besides the mathematical fra...
日本語教師がいかに日本語を分析するのかを探るため、現職日本語教師に対し調査を行った。そして、類義副詞の違いを探る過程を観察し、分析ストラテジーの種類と使用の特徴を調べた。その結果、例文作成ストラテジー...
В работе рассматривается возможность частичной автоматизации технологии построения терминологических...
В данной статье описана семантическая метрика извлечения списка терминов из текстов конкретной пробл...
本研究ではクラスタリングを利用して動詞の類義語を獲得する方法について検討している.先行研究において,同時に2つの要素のクラスタを考慮しながらクラスタリングする同時共起クラスタリングを適用して,ベクトル...
テキスト中に現れる動詞と名詞の格関係を利用して動詞のクラスタリングを行い意味的に類似の集合の構築を目指す.ここでの問題は名詞と動詞はそれぞれ多義であり,かつその語義が観測可能でないことである.本稿では...
本稿では複合名詞に着目したWeb検索結果のクラスタリング手法を提案する.本手法では検索結果のタイトルと要約を利用し,階層的で一つの検索結果が複数のクラスタに含まれることを認めるクラスタリングを行う.本...
В работе рассматривается задача кластеризации терминологической сети, а также способ ее решения; пре...
短语作为搜索引擎输入的主要信息,其主题抽取对于搜索引擎判断搜索者的搜索意图,提高搜索服务质量具有重要的意义。短语逐渐成为网络信息的重要组成部分,针对短语语义分类可以很好地将短语信息分门别类,使人们可以...
本論文では,専門用語を専門分野コーパスから自動抽出する方法の提案と実験的評価を報告する.本論文では名詞(単名詞と複合名詞) を対象として専門用語抽出について検討する.基本的アイデアは,単名詞のバイグラ...
これまでに, データベースに対する検索システムは, 精度, 再現度, 速度ともにめざましく進歩した. 検索は生活のあらゆるレベルに浸透し, コモディティ化したため, 検索に対する要求も性能面はもちろん...
Рассматривается задача преобразования терминологической сети в толковый словарь идеографического тип...
ワーキングメモリの音韻ループ研究において,言語リストの再生を妨害する二次課 題として,構音抑制が広く用いられている。本研究は,構音ではなく,書字が言語リストの系列再生に及ぼす影響を検討することを目的と...
文本聚类技术是一门很热门且有前景的技术,由于具有无监督学习的特性,在文本挖掘领域文本聚类的核心思想相对来说比较简单易懂。文本聚类可分为三个大部分:文本预处理、文本表示模型以及聚类算法设计,其中文本表示...
对检索结果进行聚类能够方便用户从搜索结果中快速地找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以达到预期效果.该文提出了一种新的思路...
テキストコーパスからの複合語用語抽出においては、抽出精度を低下させることなく、出現頻度の低い候補まで抽出することが重要である。従来主として用いられてきた統計的手法では、特に低頻度の用語候補の抽出に問題...
日本語教師がいかに日本語を分析するのかを探るため、現職日本語教師に対し調査を行った。そして、類義副詞の違いを探る過程を観察し、分析ストラテジーの種類と使用の特徴を調べた。その結果、例文作成ストラテジー...
В работе рассматривается возможность частичной автоматизации технологии построения терминологических...
В данной статье описана семантическая метрика извлечения списка терминов из текстов конкретной пробл...
本研究ではクラスタリングを利用して動詞の類義語を獲得する方法について検討している.先行研究において,同時に2つの要素のクラスタを考慮しながらクラスタリングする同時共起クラスタリングを適用して,ベクトル...
テキスト中に現れる動詞と名詞の格関係を利用して動詞のクラスタリングを行い意味的に類似の集合の構築を目指す.ここでの問題は名詞と動詞はそれぞれ多義であり,かつその語義が観測可能でないことである.本稿では...
本稿では複合名詞に着目したWeb検索結果のクラスタリング手法を提案する.本手法では検索結果のタイトルと要約を利用し,階層的で一つの検索結果が複数のクラスタに含まれることを認めるクラスタリングを行う.本...
В работе рассматривается задача кластеризации терминологической сети, а также способ ее решения; пре...
短语作为搜索引擎输入的主要信息,其主题抽取对于搜索引擎判断搜索者的搜索意图,提高搜索服务质量具有重要的意义。短语逐渐成为网络信息的重要组成部分,针对短语语义分类可以很好地将短语信息分门别类,使人们可以...
本論文では,専門用語を専門分野コーパスから自動抽出する方法の提案と実験的評価を報告する.本論文では名詞(単名詞と複合名詞) を対象として専門用語抽出について検討する.基本的アイデアは,単名詞のバイグラ...
これまでに, データベースに対する検索システムは, 精度, 再現度, 速度ともにめざましく進歩した. 検索は生活のあらゆるレベルに浸透し, コモディティ化したため, 検索に対する要求も性能面はもちろん...
Рассматривается задача преобразования терминологической сети в толковый словарь идеографического тип...
ワーキングメモリの音韻ループ研究において,言語リストの再生を妨害する二次課 題として,構音抑制が広く用いられている。本研究は,構音ではなく,書字が言語リストの系列再生に及ぼす影響を検討することを目的と...
文本聚类技术是一门很热门且有前景的技术,由于具有无监督学习的特性,在文本挖掘领域文本聚类的核心思想相对来说比较简单易懂。文本聚类可分为三个大部分:文本预处理、文本表示模型以及聚类算法设计,其中文本表示...
对检索结果进行聚类能够方便用户从搜索结果中快速地找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以达到预期效果.该文提出了一种新的思路...
テキストコーパスからの複合語用語抽出においては、抽出精度を低下させることなく、出現頻度の低い候補まで抽出することが重要である。従来主として用いられてきた統計的手法では、特に低頻度の用語候補の抽出に問題...
日本語教師がいかに日本語を分析するのかを探るため、現職日本語教師に対し調査を行った。そして、類義副詞の違いを探る過程を観察し、分析ストラテジーの種類と使用の特徴を調べた。その結果、例文作成ストラテジー...
В работе рассматривается возможность частичной автоматизации технологии построения терминологических...
В данной статье описана семантическая метрика извлечения списка терминов из текстов конкретной пробл...