数学中国

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 4415|回复: 0

[求助]请教语言处理中的概率计算问题

[复制链接]
发表于 2006-8-17 16:23 | 显示全部楼层 |阅读模式
汉语有n=400个音节,可以重复使用,问在m=15个音节的拼音串中出现k=3,
如..ni...mai...shu…的概率如何计算?省略号表示音节或汉字中间,可以插入
其它词语,但秩序不能变。
我先考虑一个简单的情况,设n=7,m=4,k=3: a、b、c、d、e、f、g重复使用有7^4=2041种排列,其中出现 …b…g…d…的排列,共有4类:#bgd b#gd bg#d bgd#,#表示a、b、c、d、e、f、g中任意一个字母,每类有7个排列,共28个排列,但实际结果应为25/2041。因为bbgd、bggd、bgdd三个排列是重复的,应该多退少补,所以不能用(7^(4-3)) * (C 3/ 4 )/ (7^4)计算为28/2401,但我得不出通用公式,请高人帮助。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|数学中国 ( 京ICP备05040119号 )

GMT+8, 2024-5-6 03:29 , Processed in 0.072265 second(s), 15 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表