Apache Tika server

Apache Tika is a toolkit for detecting and extracting metadata and structured text content from various documents using existing parser libraries.

Homepage POM file JAR file Javadoc

'org.apache.tika:tika-server:1.8'

<dependency>
	<groupId>org.apache.tika</groupId>
	<artifactId>tika-server</artifactId>
	<version>1.8</version>
</dependency>

<dependency org="org.apache.tika" name="tika-server" rev="1.8"/>

"org.apache.tika", "tika-server", "1.8"

Dependencies

Compile dependencies

commons-cli » commons-cli » 1.2
commons-lang » commons-lang » 2.5
javax.mail » mail » 1.4.4
net.sf.opencsv » opencsv » 2.0
org.apache.cxf » cxf-rt-frontend-jaxrs » 3.0.3
org.apache.cxf » cxf-rt-rs-security-cors » 3.0.3
org.apache.cxf » cxf-rt-transports-http-jetty » 3.0.3
org.apache.tika » tika-parsers » 1.8
org.apache.tika » tika-serialization » 1.8
org.apache.tika » tika-xmp » 1.8
org.slf4j » slf4j-jcl » 1.6.1

Test dependencies

junit » junit » 4.11
org.apache.cxf » cxf-rt-rs-client » 3.0.3
org.apache.cxf » cxf-rt-rs-service-description » 3.0.3
org.apache.tika » tika-core » 1.8
org.apache.tika » tika-parsers » 1.8