Package outils

Class HyphenationToolkit


  • public class HyphenationToolkit
    extends java.lang.Object
    Classe permettant de mettre en place et de configurer la coupure littéraire à partir de dictionnaires de patterns de coupure (basé sur l'algo de Liang)
    • Method Summary

      All Methods Static Methods Concrete Methods Deprecated Methods 
      Modifier and Type Method Description
      static boolean fabriqueDico​(java.lang.String dico, java.lang.String dicoNat, java.lang.String encodage)
      Construit le dictionnaire de coupure (en xsl) à partir d'un dictionnaire existant au format .dic (Tex)
      static boolean fabriqueDicoNat​(java.lang.String dico, java.lang.String dicoNat, java.lang.String encodage)
      Construit le dictionnaire de coupure de nat (en xsl) à partir d'un dictionnaire existant au format .dic (Tex)
      static java.util.ArrayList<java.lang.String> getRules​(java.lang.String dico)
      Renvoie une liste contenant les règles de coupures de nat
      static java.util.ArrayList<java.lang.String> getRules​(java.lang.String dico, java.lang.String encodage)
      Renvoie une liste contenant les règles de coupures de nat
      static java.util.ArrayList<java.util.ArrayList<java.lang.String>> getRulesOrdered​(java.lang.String dicoNat)
      Deprecated.
      a priori ne sert plus car le critère de longueur de règle ne sert pas dans les règles de coupures
      static void main​(java.lang.String[] a)
      méthode de test
      static boolean writeRules​(java.util.ArrayList<java.lang.String> rules, java.lang.String dico)
      Ecrit les règles contenus dans rules dans le fichier dico en utilisant l'encodage encodageDefaut.
      static boolean writeRules​(java.util.ArrayList<java.lang.String> rules, java.lang.String dico, java.lang.String encodage)
      Ecrit les règles contenus dans rules dans le fichier dico en utilisant l'encodage encodage.
      • Methods inherited from class java.lang.Object

        clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
    • Constructor Detail

      • HyphenationToolkit

        public HyphenationToolkit()
    • Method Detail

      • fabriqueDico

        public static boolean fabriqueDico​(java.lang.String dico,
                                           java.lang.String dicoNat,
                                           java.lang.String encodage)
        Construit le dictionnaire de coupure (en xsl) à partir d'un dictionnaire existant au format .dic (Tex)

        Adapte les patterns pour les expressions régulières en xsl:

        • remplacement des . du début par ^
        • remplacement des . de fin par $
        • doublement des apostrophes

        Fabrique le fichier hyphenation.xsl contenant les patterns de coupure

        Parameters:
        dico - l'adresse du dictionnaire existant au format .dic
        dicoNat - adresse de la feuille xsl de coupure
        encodage - encodage du dictionnaire dico
        Returns:
        true si le dictionnaire a été créé correctement, false sinon
        Since:
        2.0
      • fabriqueDicoNat

        public static boolean fabriqueDicoNat​(java.lang.String dico,
                                              java.lang.String dicoNat,
                                              java.lang.String encodage)
        Construit le dictionnaire de coupure de nat (en xsl) à partir d'un dictionnaire existant au format .dic (Tex)

        Adapte les patterns pour les expressions régulières en xsl:

        • remplacement des . du début par ^
        • remplacement des . de fin par $
        • doublement des apostrophes

        Fabrique le fichier hyphen.xsl contenant les patterns de coupure

        Parameters:
        dico - l'adresse du dictionnaire existant au format .dic
        dicoNat - adresse de la feuille xsl de coupure
        encodage - encodage du dictionnaire dico
        Returns:
        true si le dictionnaire a été créé correctement, false sinon
        Since:
        2.0
      • getRulesOrdered

        @Deprecated
        public static java.util.ArrayList<java.util.ArrayList<java.lang.String>> getRulesOrdered​(java.lang.String dicoNat)
        Deprecated.
        a priori ne sert plus car le critère de longueur de règle ne sert pas dans les règles de coupures
        Renvoie une liste double contenant les règles de coupures de nat regroupées par longueur de règle

        La liste renvoyée contient des sous-listes dont les règles sont de même longueur pour chaque sous-liste

        Parameters:
        dicoNat - l'adresse du dictionnaire de coupure
        Returns:
        la double liste conteannt les règles de coupure
        Since:
        1.5
      • getRules

        public static java.util.ArrayList<java.lang.String> getRules​(java.lang.String dico)
        Renvoie une liste contenant les règles de coupures de nat

        La liste renvoyée est ordonnée telle que dans le fichier de règle

        Adapte les patterns pour les expressions régulières en xsl:

        • remplacement des . du début par ^
        • remplacement des . de fin par $
        • doublement des apostrophes

        utilise l'encodage par défaut (encodageDefaut)SAUF si un encodage est précisé dans le fichier de règles

        Parameters:
        dico - l'adresse du dictionnaire utilisé, au format compatible avec l'algorithme de Liang(Tex)
        Returns:
        la liste contenant les règles de coupure
        Since:
        2.0
        See Also:
        getRules(String, String)
      • getRules

        public static java.util.ArrayList<java.lang.String> getRules​(java.lang.String dico,
                                                                     java.lang.String encodage)
        Renvoie une liste contenant les règles de coupures de nat

        La liste renvoyée est ordonnée telle que dans le fichier de règles.

        Adapte les patterns pour les expressions régulières en xsl:

        • remplacement des . du début par ^
        • remplacement des . de fin par $
        • doublement des apostrophes

        utilise l'encodage spécifié par encodage ou encodageDefaut si encodage vaut null SAUF si un encodage est précisé dans le fichier de règles à la première ligne

        Parameters:
        dico - l'adresse du dictionnaire utilisé, au format compatible avec l'algorithme de Liang(Tex)
        encodage - l'encodage du fichier de règle. Si null, utilisation de l'encodage par défaut (encodageDefaut)
        Returns:
        la liste contenant les règles de coupure
        Since:
        2.0
      • writeRules

        public static boolean writeRules​(java.util.ArrayList<java.lang.String> rules,
                                         java.lang.String dico)
        Ecrit les règles contenus dans rules dans le fichier dico en utilisant l'encodage encodageDefaut.

        Les règles sont sous la forme de regex compatibles avec xsl. Cette fonction remplace:

        • les ^ du début par .
        • les $ de fin par .
        • les apostrophes doublées par une apostrophe.
        Parameters:
        rules - ArrayList des règles au format xsl-compatible
        dico - L'adresse du fichier dictionnaire
        Returns:
        true si l'écriture dans dico s'est bien déroulée
        Since:
        2.0
        See Also:
        writeRules(ArrayList, String, String)
      • writeRules

        public static boolean writeRules​(java.util.ArrayList<java.lang.String> rules,
                                         java.lang.String dico,
                                         java.lang.String encodage)
        Ecrit les règles contenus dans rules dans le fichier dico en utilisant l'encodage encodage.

        Les règles sont sous la forme de regex compatibles avec xsl. Cette fonction remplace:

        • les ^ du début par .
        • les $ de fin par .
        • les apostrophes doublées par une apostrophe.
        Parameters:
        dico - ArrayList des règles au format xsl-compatible
        encodage - Encodage du fichier dico
        rules - L'adresse du fichier dictionnaire
        Returns:
        true si l'écriture dans dico s'est bien déroulée
        Since:
        2.0
      • main

        public static void main​(java.lang.String[] a)
        méthode de test
        Parameters:
        a - unused