python实现中文数字转阿拉伯数字

情景分析

(1) 零在中文数字串中起补位作用,处理的时候可以忽略掉
(2) 一十通常直接缩减为十,意味着十前获取不到数字时为一十
(3) 单位千、百、十前的数为单个数字
(4) 单位万前的数可以由(3)复合而成
(5) 单位亿前的数可以由(3)、(4)及亿本身复合而成

代码实现

digit = {'一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9}
def _trans(s):
    num = 0
    if s:
        idx_q, idx_b, idx_s = s.find('千'), s.find('百'), s.find('十')
        if idx_q != -1:
            num += digit[s[idx_q - 1:idx_q]] * 1000
        if idx_b != -1:
            num += digit[s[idx_b - 1:idx_b]] * 100
        if idx_s != -1:
            # 十前忽略一的处理
            num += digit.get(s[idx_s - 1:idx_s], 1) * 10
        if s[-1] in digit:
            num += digit[s[-1]]
    return num
def trans(chn):
    chn = chn.replace('零', '')
    idx_y, idx_w = chn.rfind('亿'), chn.rfind('万')
    if idx_w < idx_y:
        idx_w = -1
    num_y, num_w = 100000000, 10000
    if idx_y != -1 and idx_w != -1:
        return trans(chn[:idx_y]) * num_y + _trans(chn[idx_y + 1:idx_w]) * num_w + _trans(chn[idx_w + 1:])
    elif idx_y != -1:
        return trans(chn[:idx_y]) * num_y + _trans(chn[idx_y + 1:])
    elif idx_w != -1:
        return _trans(chn[:idx_w]) * num_w + _trans(chn[idx_w + 1:])
    return _trans(chn)

测试例子

print(trans('十') == 10) 
print(trans('一百零一') == 101)
print(trans('九百二十一') == 921)
print(trans('五十六万零一十') == 560010)
print(trans('一万亿零二千一百零一') == 1000000002101)
print(trans('一万亿二千一百万零一百零一') == 1000021000101)
print(trans('一万零二百三十亿四千零七千八百九十') == 1023000007890)

相关推荐