Apache Tika core

Apache Tika is a toolkit for detecting and extracting metadata and structured text content from various documents using existing parser libraries.

Homepage POM file JAR file Javadoc

'org.apache.tika:tika-core:0.4'

<dependency>
	<groupId>org.apache.tika</groupId>
	<artifactId>tika-core</artifactId>
	<version>0.4</version>
</dependency>

<dependency org="org.apache.tika" name="tika-core" rev="0.4"/>

"org.apache.tika", "tika-core", "0.4"

Dependencies