参考
Token | Cloud Natural Language API | Google Cloud
以下引用部分は上記URLを翻訳したもの
出力例
私: Ofset: -1 Part_Of_Speech: tag: PRON person: FIRST proper: NOT_PROPER Dependency_Edge: 2 は: Ofset: -1 Part_Of_Speech: tag: PRT proper: NOT_PROPER Dependency_Edge: 0 犬: Ofset: -1 Part_Of_Speech: tag: NOUN proper: NOT_PROPER Dependency_Edge: 2 です: Ofset: -1 Part_Of_Speech: tag: VERB form: FINAL_ENDING proper: NOT_PROPER Dependency_Edge: 2 。: Ofset: -1 Part_Of_Speech: tag: PUNCT proper: NOT_PROPER Dependency_Edge: 2
I: Ofset: -1 Part_Of_Speech: tag: PRON case: NOMINATIVE number: SINGULAR person: FIRST Dependency_Edge: 1 am: Ofset: -1 Part_Of_Speech: tag: VERB mood: INDICATIVE number: SINGULAR person: FIRST tense: PRESENT Dependency_Edge: 1 a: Ofset: -1 Part_Of_Speech: tag: DET Dependency_Edge: 3 dog: Ofset: -1 Part_Of_Speech: tag: NOUN number: SINGULAR Dependency_Edge: 1 .: Ofset: -1 Part_Of_Speech: tag: PUNCT Dependency_Edge: 1
分かったこと
英語の方が多くの情報が抽出される(UNKNOWNが少ない)
概要
Tokensが重要そう。
partOfSpeech、lemma、dependencyEdgeを一個づつ見てみる。