segment

Type Members

class BigramStatistics extends AnyRef

User: apassos Date: 8/19/13 Time: 2:00 PM
class CUHChainChineseWordSegmenter extends ChainChineseWordSegmenter
class ChainChineseWordSegmenter extends DocumentAnnotator
class DehyphenatingTokenizer[T <: DocumentAnnotator] extends DocumentAnnotator

concatenates words split by hyphens in the original text based on user-provided dictionary or other words in the same document.
class DeterministicSentenceSegmenter extends DocumentAnnotator

Segments a sequence of tokens into sentences.
class DeterministicTokenizer extends DocumentAnnotator

Split a String into a sequence of Tokens.
class MSRChainChineseWordSegmenter extends ChainChineseWordSegmenter

A linear-chain CRF model for Chinese word segmentation with four companion objects, each pre-trained on a different corpus that corresponds to a different variety of written Mandarin.
class OntonotesNormalizedTokenString extends PlainNormalizedTokenString
class PhraseSectionList extends ArrayBuffer[Section]

A sequence of sections which are tokenized as phrases.
class PhraseTokenizer extends DocumentAnnotator

A tokenizer which will merge existing tokens if they are from one of the phrases given.
class PhraseTrie extends AnyRef
class PlainNormalizedTokenString extends TokenString
class PunktTokenizer extends DocumentAnnotator
abstract class SegmentationLabelDomain extends CategoricalDomain[String] with SegmentedCorpusLabeling
trait SegmentedCorpusLabeling extends AnyRef
sealed trait SentenceBoundaryInference extends AnyRef
class TokenNormalizer1[A <: TokenString] extends DocumentAnnotator

Clean up Token.
sealed trait TokenType extends AnyRef

Value Members

object A extends TokenType with Product with Serializable
object AS extends TokenType with Product with Serializable
object BIOSegmentationDomain extends SegmentationLabelDomain
object BritishToAmerican extends HashMap[String, String]
object CUHChainChineseWordSegmenter extends CUHChainChineseWordSegmenter
object DefaultRules
object DeterministicSentenceSegmenter extends DeterministicSentenceSegmenter
object DeterministicTokenizer extends DeterministicTokenizer
object JointlyAcrossDocuments extends SentenceBoundaryInference with Product with Serializable
object MSRChainChineseWordSegmenter extends MSRChainChineseWordSegmenter
object Non extends SentenceBoundaryInference with Product with Serializable
object OntonotesTokenNormalizer extends TokenNormalizer1[OntonotesNormalizedTokenString]
object PerDocument extends SentenceBoundaryInference with Product with Serializable
object PhraseTokenizerModes extends Enumeration
object PlainTokenNormalizer extends TokenNormalizer1[PlainNormalizedTokenString]
object PunktSentenceSegmenter
object PunktTokenizer extends PunktTokenizer
object S extends TokenType with Product with Serializable
object U extends TokenType with Product with Serializable

package segment

Type Members

class BigramStatistics extends AnyRef

class CUHChainChineseWordSegmenter extends ChainChineseWordSegmenter

class ChainChineseWordSegmenter extends DocumentAnnotator

class DehyphenatingTokenizer[T <: DocumentAnnotator] extends DocumentAnnotator

class DeterministicSentenceSegmenter extends DocumentAnnotator

class DeterministicTokenizer extends DocumentAnnotator

class MSRChainChineseWordSegmenter extends ChainChineseWordSegmenter

class OntonotesNormalizedTokenString extends PlainNormalizedTokenString

class PhraseSectionList extends ArrayBuffer[Section]

class PhraseTokenizer extends DocumentAnnotator

class PhraseTrie extends AnyRef

class PlainNormalizedTokenString extends TokenString

class PunktTokenizer extends DocumentAnnotator

abstract class SegmentationLabelDomain extends CategoricalDomain[String] with SegmentedCorpusLabeling

trait SegmentedCorpusLabeling extends AnyRef

sealed trait SentenceBoundaryInference extends AnyRef

class TokenNormalizer1[A <: TokenString] extends DocumentAnnotator

sealed trait TokenType extends AnyRef

Value Members

object A extends TokenType with Product with Serializable

object AS extends TokenType with Product with Serializable

object BIOSegmentationDomain extends SegmentationLabelDomain

object BritishToAmerican extends HashMap[String, String]

object CUHChainChineseWordSegmenter extends CUHChainChineseWordSegmenter

object DefaultRules

object DeterministicSentenceSegmenter extends DeterministicSentenceSegmenter

object DeterministicTokenizer extends DeterministicTokenizer

object JointlyAcrossDocuments extends SentenceBoundaryInference with Product with Serializable

object MSRChainChineseWordSegmenter extends MSRChainChineseWordSegmenter

object Non extends SentenceBoundaryInference with Product with Serializable

object OntonotesTokenNormalizer extends TokenNormalizer1[OntonotesNormalizedTokenString]

object PerDocument extends SentenceBoundaryInference with Product with Serializable

object PhraseTokenizerModes extends Enumeration

object PlainTokenNormalizer extends TokenNormalizer1[PlainNormalizedTokenString]

object PunktSentenceSegmenter

object PunktTokenizer extends PunktTokenizer

object S extends TokenType with Product with Serializable

object U extends TokenType with Product with Serializable

Ungrouped