摘 要 本实验选取新疆呼 图壁种牛场1984年~1995年的黑白花牛、西门塔尔牛、蒙贝利亚牛的1810个泌乳期日奶量资料,采用不累加和累加、10d间隔和30d间隔4种数据处理组合方式,使用SAS软件的非线性回归(NLIN)过程,对所有个体泌乳过程进行拟合,模型分别为:多项式、逆多项式(①、②)、伍德(①、②)、改进伍德和回归模型。结果30d间隔数据的全相关指数R2比10d间隔的好,累加数据的R2比不累加的高,差异非常显著。使用DFREML对产奶量、模型参数的遗传参数和表型相关及个体育种值采用动物模型进行了计算,结果改进伍德模型的参数b、d的遗传力较高,为0.33和0.34,与产奶量的遗传相关也很高,为-0.99和0.98,对用产奶量和模型参数进行育种值排队的秩相关的检验结果为极显著。 关键词 泌乳曲线,数学模型,参数的遗传分析 SIMULATING OF LACTATION CURVES AND GENETIC ANALYSIS OF THEIR MATHEMATICAL MODEL′S PARAMETERS Wang Yachun,Chen Youchun (Institute of Animal Science,CAAS,Beijing 100094) Bai Rong,Mu Shajiang,Yan Shuzhen,Sun Yanfei,Wang Xiaohua,Deng Jiangling (Hu Tubi Cattle Breeding Farm,Xin Jiang 831203) Abstract 1810 lactations′ daily milk yield data of Holstein,Simmental and Montbeli arde cows were collected from 1984 to 1995 in Xinjiang Hutubi Farm.With 10 days and 30 days interval,normal and Grey-accumulated method,through SAS software,all individual lactation curves are simulated.Mathematical models used are Polynomial,Inverse polynomial,Wood,Modified Wood and Regressive model.The results show that R2 value of 30 days interval is highe r than 10 days′,and R2 of accumulated data is much higher than that of normal one.The heritability of parameter b and d of modified Wood model are the highest,0.33 and 0.34,respectively.The genetic co rrelation between milk yield and b,d are also the highest,-0.99 and 0.98,respectively. Ranks of individual breeding value of some parameters are compared with their rank on milk by Spearman′s correlation,it is tested to be significant. Key word Lactation curve,M athematical model,Genetic analysis of parameter 研究泌乳曲线,主要考虑以下有几个要素:(1)准确的取样方法;(2)简单易行、准确 度高又有高度的产奶遗传代表性的数学模型;(3)结合实践,制定有实际生产意义的选择指数,提高选种的准确性。 本文从研究的第一方面入手,设立10d、30d的两种时间间隔,另外应用灰色数学理论使用累加方法,共形成4种数据组合;从文献中选取7种简单易行、R2普遍较高的模型,对所有4种数据进行非线性拟合,最后对数学模型的参数进行遗传分析,进而研究用数学模型的参数计算个体育种值,探索泌乳曲线的实践应用,为进一步深入研究泌乳曲线打下基础。 1 材料与方法 1.1 取材 新疆呼图壁种牛场3个分场(1984年~1994年7月)西门塔尔牛、蒙贝利亚牛、黑白花牛的泌乳天数不少于270d 1810个泌乳期的各胎次日产奶记录(每10d测一次),超过305d的截取至305d。 1.2 拟合泌乳曲线的数学模型 据Anderson,S.M.等(1989)[2]报道,以10d为取样间隔最佳,但30d为间隔的测定方法最实用,故本研究采用10d和 30d为间隔的方式分别截取数据。并选用包括Wood模型在内的以下7种模型进行产奶曲线拟合[1、3、4、5、7]。 多项式模型(Polynomial model):Yt=k1+k2t+k3 t2+k4ln(t)+εt ……模型(1) 逆多项式①(Inverse Polynomial model)模型(误差加形式): ……模型(2) 逆多项式②(Inverse Polynomial model)模型(误差乘形式) : ……模型(3) 伍德①(Wood)模型(误差乘形式):Yt=Atbe-ctεt……模型(4) 伍德②(Wood)模型(误差加形式):Yt=Atbe-ct+εt……模型(5) 改进伍德模型(Modified Wood):Yt=A-kt+Ae-ct+εt……模型(6) 回归模型(Regression):Yt=p0+p1rt+p2r2t+p3wt+p4w2t+εt……模型(7) 式中:rt=t/305,wt=ln(305/t),εt为残差。 拟合曲线时,曲线参数的估计用SAS(Statistical Analysis System)程序回归分析过程中的非线性回归分析(NLIN)进行[11]。 1.3 数据处理方法 本研究采用灰色数学数据变换中的累加法,将日奶量折合成累计产奶量(Accumulated milk yield),以增加拟合的精确度。 1.4 数学模型拟合泌乳曲线的准确度的度量 采用全相关指数和全期奶量相对误差,前者是对于曲线的每一点值的估测准确度进行计算,后者是从产奶全过程角度,考虑估测的产奶总量与实际产奶总量的差异程度。 1.5 遗传模型、固定效应分析 据Ferris(1985)等[5、7、8、9、12]报道,除遗传因素影响产奶量外,还有许多固定效应和环境因素,最重要的有:品种、胎次、产奶年份、产犊季节、场等。本研究拟将以上各个因素都纳入模型中,另外还对产奶量的高低进行分组。本实验中涉及的公牛108头,采用动物模型,软件采用DFREML(非求导REML,软件由中国农业大学张沅教授提供)。 遗传模型如下: Y=μ+Farm-Breed+Season+Parity+Year+Production-Group+Random+error 模型的矩阵形式可写成如下: Y=Xb+ Y:n×1阶观察值向量 X:固定效应结构矩阵(5+12+10+12+3=42×n阶) b:固定效应向量(5+12+10+12+3=42×1阶) :随机效应结构矩阵(1810×n阶) :随机效应向量(1810×1阶) :随机残差向量(n×1阶) 1.6 遗传方差组分、协方差组分的估计 本文采用非求导REML-DFREML,利用方差组分和协方差组分对产奶量的遗传力、参数的遗传力、产奶与参数及参数间的遗传相关、表型相关进行估计。 应用动物模型估计个体育种值,比较了用实际产奶量计算出的育种值,与用模型参数中具有高遗传力者计算出的育种值的排队情况,采用检验排序差异性的Spearman秩相关进行检验[10]。 2 结果与分析 2.1 泌乳曲线拟合结果及其准确度评价 应用SAS软件中非线性拟合过程(NLIN)对全部资料中1810头次全期泌乳数据进行曲线拟合,计算其每泌乳期拟合全相关指数,见表1。 表1 数据拟合结果 Table l Results of data simulation R2 模型 Model 1 2 3 4 5 6 7 10d不累加 Interval 10 days without accumulation 0.6828 0.6079 0.5004 0.6154 0.6258 0.4977 0.7274 10d累加 Interval 10 days with accumulation 0.9994 0.9900 0.9783 0.9991 0.9852 0.9924 0.9994 30d不累加 Interval 30 days without accumulation 0.7733 0.6736 0.6602 0.6950 0.6966 0.5785 0.8296 30d累加 Interval 30 days with accumulation 0.9994 0.9920 0.9940 0.9991 0.9945 0.9913 0.9997 从表1中可看出,不累加数据与累加数据的曲线拟合全相关指数的差异很大,累加后数据在7种模型中的模拟情况均好于不累加数据。在不累加数据的拟合时,少数数据在拟合时溢出,在误差平方和、R2值中出现异常值,这是由于不经累加处理的数据受各种偶然因素的影响,不利于曲线模拟。 数据经累加后,消除了泌乳过程中的偶然变化,R2值提高幅度大,平均值从0.6~0.7提高到全部在0.98以上,这在文献中没有报道,比储明星(1991)报道的群体平均R2值高。 对7种模型估计的全期总奶量值与实际奶量作了相对误差分析,数据累加与不累加的拟合结果在实际生产中都是可行的,相对误差0~4.56%。 2.2 泌乳曲线数学模型参数遗传参数和表型相关的估计结果及实践检验 分别对7种数学模型拟合10d和30d间隔的累加数据所得参数进行遗传分析,同时计算了表型相关、遗传力和部分遗传相关,计算结果如表2和表3。 由表2可见,大多数的参数遗传力很低(<0.1),只有模型6的3个参数和模型5的参数a,模型3的参数z0,模型2的参数z0遗传力达到了0.1以上,说明各模型虽然都 能够很精确的拟合泌乳过程,但并不都能同样很好地揭示泌乳过程的遗传机制,下表列出遗传力大于0.1的参数与其它模型参数和产奶量间的遗传相关结果。 表2 7种模型参数在10d和30d间隔下遗传力结果 Table 2 Results of heritability of parameters of 7 kinds of models at 10 and 30 days′interval 模型 Model 模型参数遗传力(10天和30天间隔)(产奶量遗传力为0.34) Heritability of parameters of 7 kinds of models at 10 and 30 days′interval (Heritability of milk yield is 0.34) 1 k1:0.08,0.00 k2:0.04,0.03 k3:0.04,0.03 k4:0.08,0.0 1 2 z0:0.11,0.07 z1:0.04,0.00 z 2:0.02,0.00 3 z0:0.12,0.10 z1:0.08,0.04 z2:0 .07,0.03 4 A:0.09,0.07 b:0.05,0.03 c:0.06,0.03 5 a:0.17,0.08 b:0.05,0.01 c:0.04,0.02 6 a:0.17,0.12 b:0.33,0.33 d:0.34,0.34 7 p0:0.03,0.0 p1:0.05,0.0 p2:0.04,0.01 p3:0.03,0.0 p4:0.02,0.0 注:表中遗传力值是由迭代程序计算,因仅精确到小数点后两位,故遗传力值0.00只表示遗传力极小。 Note:the value is counted out from iteration,so 0.00 only means that the heritability is very small. 从表3可见不论参数间或是与产奶量间相关变异很大。同时具有高遗传力和与产奶量的高遗 传相关的就只有模型2的参数z0和模型6的参数b、d。所有计算参数的育种值排队与用产奶量计算育种值排队呈显著秩相关,尤其是模型6的参数b、d,秩相关值极高,公牛排队中位于前20名的公牛基本不变。 表3 模型参数(遗传力0.1以上)间及参数与产奶量间遗传相关结果 Table 3 Results of genetic correlation between parameters(h2>0.1) of models and milk yield and eachother 模型参数 Parameter of model 遗传相关(10天和30天间隔) Genetic correlation between parameters of models with milk yield and each other at 10 and 30 days′interval 模型2 z0 Mode l l z1:-0.94,—— z2:1.00,—— 奶量Milk yield:-0.56,-0.71 模型3 a Model 2 b:-0.92,-0.93 c: 0.90,1.00 奶量 Milk yield:-0.50,-0.53 模型5 a Model 3 b:-1.00,-0.83 c:0.7 3,-0.30 奶量 Milk yield:-0.35,-0.47 模型6 a Model 4 b:0.47,0.49 d:-0.53 ,-0.54 奶量 Milk yield:-0.41,-0.40 模型6 b Model 5 b:-1.00,-0.99 奶量 Mi lk yield:-0.99,-0.99 模型6 d Model 6 奶量 Milk yield:0.99, 0.98 注:遗传相关值由迭代程序计算,因仅精确到小数点后两位,故相关值1.00或-1.00只表示相关程度极高。 Note:the value is counted out from iteration,so 1.00 or-1.00 only means that the genetic correlation is very big.