run.py

# -*- coding: utf-8 -*-

import argparse

from ctc import CTCParser
from supar.cmds.run import init


def main():
    parser = argparse.ArgumentParser(description='Create CTC Parser.')
    parser.set_defaults(Parser=CTCParser)
    parser.add_argument('--eval-tgt', action='store_true', help='whether to evaluate tgt')
    parser.add_argument('--lev', action='store_true', help='whether to evaluate P/R/F using levenshtein')
    parser.add_argument('--prefix', action='store_true', help='whether to perform prefix decoding')
    parser.add_argument('--glat', type=float, default=0, help='GLAT sampling ratio')
    parser.add_argument('--iteration', type=int, default=1, help='times of iterative decoding')
    subparsers = parser.add_subparsers(title='Commands', dest='mode')
    # train
    subparser = subparsers.add_parser('train', help='Train a parser.')
    subparser.add_argument('--build', '-b', action='store_true', help='whether to build the model first')
    subparser.add_argument('--checkpoint', action='store_true', help='whether to load a checkpoint to restore training')
    subparser.add_argument('--encoder', choices=['lstm', 'transformer', 'bert'], default='bert', help='encoder to use')
    subparser.add_argument('--buckets', default=32, type=int, help='max num of buckets to use')
    subparser.add_argument('--train', default='data/clang8.train', help='path to train file')
    subparser.add_argument('--dev', default='data/bea19.dev', help='path to dev file')
    subparser.add_argument('--test', default='data/conll14.test', help='path to test file')
    subparser.add_argument('--embed', default='glove-6b-100', help='file or embeddings available at `supar.utils.Embedding`')
    subparser.add_argument('--vocab', action='store_true', help='extend the vocab from new data')
    # evaluate
    subparser = subparsers.add_parser('evaluate', help='Evaluate the specified parser and dataset.')
    subparser.add_argument('--buckets', default=8, type=int, help='max num of buckets to use')
    subparser.add_argument('--data', default='data/conll14.test', help='path to dataset')
    # predict
    subparser = subparsers.add_parser('predict', help='Use a trained parser to make predictions.')
    subparser.add_argument('--buckets', default=8, type=int, help='max num of buckets to use')
    subparser.add_argument('--data', default='data/conll14.test', help='path to dataset')
    subparser.add_argument('--pred', default='pred.txt', help='path to predicted result')
    subparser.add_argument('--prob', action='store_true', help='whether to output probs')
    init(parser)


if __name__ == "__main__":
    main()