Apache Tika

The Apache Tika™ toolkit detects and extracts metadata and structured text content from various documents using existing parser libraries.

Homepage POM file JAR file Javadoc

'org.apache.tika:tika:1.7'

<dependency>
	<groupId>org.apache.tika</groupId>
	<artifactId>tika</artifactId>
	<version>1.7</version>
</dependency>

<dependency org="org.apache.tika" name="tika" rev="1.7"/>

"org.apache.tika", "tika", "1.7"

Dependencies

no dependencies