您好,欢迎来到化拓教育网。
搜索
您的当前位置:首页用于质谱分析核酸的方法和组合物[发明专利]

用于质谱分析核酸的方法和组合物[发明专利]

来源:化拓教育网
[19]中华人民共和国国家知识产权局

[12]发明专利申请公开说明书

[21]申请号98809047.3

[51]Int.CI7

C07H 21/00C12Q 1/68

[43]公开日2000年10月18日[22]申请日98.7.22

[21]申请号98809047.3

[11]公开号CN 1270598A

[74]专利代理机构中国国际贸易促进委员会专利商标

事务所

代理人黄革生

[30]优先权

[32]1997.07.22 [33]US [31]08/8,180[32]1997.07.22 [33]US [31]08/8,501[32]1997.07.22 [33]US [31]08/8,5[86]国际申请PCT/US98/15008 1998.07.22[87]国际公布WO99/05319 EN 1999.02.04[85]进入国家阶段日期

2000.03.10

[71]申请人拉普吉恩公司

地址美国华盛顿

[72]发明人J·范尼斯 J·C·塔伯恩 J·豪伯特 J·

T·穆里甘

权利要求书 12 页 说明书 205 页 附图 31 页

[54]发明名称

用于质谱分析核酸的方法和组合物

[57]摘要

本发明公开了为各种核酸反应而特别设计的标记和接头,它们可用于需要以大小为基础分离核酸分子的各种核酸反应中。

98809047.3

权 利 要 求 书

第1/12页

1.下式的化合物:

                    T-L-X 其中, T

ms

ms

是可用质谱法检测的有机基团,含有碳,氢和氟中的至少一

ms

种,并且选择性地含有选自氧、氮、硫、磷和碘的原子; L是可以使特有的含T开的有机基团,其中含T

部分与所述化合物的其余部分经裂解分

ms

部分含有一个官能团,当对所述化合物进

行质谱分析时,该官能团可以支持单离子电荷状态,并且所述官能团是叔胺、季胺或有机酸;

X是选自亚磷酰胺和H-磷酸酯的官能团。

2.权利要求1的化合物,其中X是亚磷酰胺基团,从而T-L-X具有如下结构

其中R是烷基或带有一个或多个选自卤素和氰基的取代基的取代烷基,并且NR2的两个R基团可以键合在一起形成环烷基。

3.权利要求2的化合物,其中X是亚磷酰胺基团,从而T-L-X具有如下结构

,并且OR是OCH2CH2CN,NR2是N(异丙基)2。

4.权利要求1的化合物,其中X是H-膦酸酯基团,从而T-L-X具有如下结构

2

98809047.3权 利 要 求 书 第2/12页

其中R是C1-C6烷基。

ms

5.权利要求1-4的化合物,其中T的质量为15-10,000道尔顿并且其分子式为C1-500N0-100O0-100S0-10P0-10HαFβIδ,其中α、β和δ的总和足以满足C、N和O原子的不足价键。

ms

6.权利要求1-4的化合物,其中的T和L通过官能团连接在一起,所述官能团选自酰胺、酯、醚、胺、硫基、硫酯、二硫基、硫醚、脲、硫脲、氨基甲酸酯、硫代氨基甲酸酯、席夫碱、还原的席夫碱、亚胺、肟、腙、磷酸酯、膦酸酯、磷酰胺、膦酰胺、磺酸酯、磺酰胺或碳-碳键。酸碱hv[O] 7.权利要求1-4的化合物,其中的L选自L、L、L、L、Δ[R]enzelcss

L、L、L、L和L,其中,可以分别通过光辐射、酸、碱、氧

ms

化、还原、酶、电化学、热和硫醇交换使含T部分从分子的其余部解下来。

hv123

8.权利要求1-4的化合物,其中的L具有式L-L-L的结构,

2ms13

其中L是可以吸收光辐射以促进T从X上裂解的分子片段,L和L

12ms32

彼此地是直连键或有机基团,其中L将L与T间隔开,L将L

213

与X间隔开,并且当L吸收光辐射时L和L均不会发生键的裂解。

23

9.权利要求8的化合物,其中-L-L具有如下结构式:

其中a、b、c、d或e位置上的一个碳原子被-L-X所取代,并且b、c、d或e位置中的一个或多个位置可选择性地被烷基、烷氧基、氟、

3

3

98809047.3

1

权 利 要 求 书 第3/12页

氯、羟基、羧基或酰胺所取代;并且R是氢或烃基。

3

10.权利要求8的化合物,其中L选自直连键、亚烃基、-O-亚烃基和亚烃基-(O-亚烃基)n-H,其中n是1到10的整数。 11.权利要求1-4的化合物,其中的-L-X具有如下结构:

其中b、c、d或e位置中的一个或多个被氢、烷基、烷氧基、氟、

12

氯、羟基、羧基或酰胺所取代;R是氢或烃基,R以“X”基团为末端。

ms

12.权利要求1-4的化合物,其中的T具有如下结构式

23

                     T-(J-T-)n-2

其中T是由碳以及氢、氟、碘、氧、氮、硫和磷中的一种或多种形成的有机部分,质量为15-500道尔顿;

3

T是由碳以及氢、氟、碘、氧、氮、硫和磷中的一种或多种形成的有机部分,质量为50-1000道尔顿;

J是直连键或选自酰胺、酯、胺、硫基、醚、硫酯、二硫基、硫醚、脲、硫脲、氨基甲酸酯、硫代氨基甲酸酯、席夫碱、还原的席夫碱、亚胺、肟、腙、磷酸酯、膦酸酯、磷酰胺、膦酰胺、磺酸酯、磺酰胺或碳-碳键的官能团;

3

n是1-50的整数,并且当n大于1时,各T和J可以彼此地进行选择。

2

13.权利要求12的化合物,其中的T选自烃基、烃基-O-亚烃基、烃基-S-亚烃基、烃基-NH-亚烃基、烃基-酰胺-亚烃基、N-(烃基)亚烃基、N,N-二(烃基)亚烃基、烃基酰基亚烃基;杂环烃基,其中的杂原子选自氧、氮、硫和磷;取代的杂环烃基,其中的杂原子选自氧、氮、硫和磷,取代基选自烃基、烃基-O-亚烃基、烃基-NH-4

98809047.3权 利 要 求 书 第4/12页

亚烃基、烃基-S-亚烃基、N-(烃基)亚烃基、N,N-二(烃基)亚烃基和烃基酰基-亚烃基,以及其中的一个或多个氢被同等数量的氟取代的上述任何基团的衍生物。

14.权利要求12的化合物,其中的T具有式-G(R)-,其中G是带有一个R取代基的C1-6亚烷基,R选自烷基、链烯基、链炔基、环烷基、芳基稠合的环烷基、环烯基、芳基、芳烷基、芳基取代的链烯基或链炔基、环烷基取代的烷基、环烯基取代的环烷基、二芳基、烷氧基、链烯氧基、链炔氧基、芳烷氧基、芳基取代的链烯氧基或链炔氧基、烷基氨基、链烯基氨基或链炔基氨基、芳基取代的烷基氨基、芳基取代的链烯基氨基或链炔基氨基、芳氧基、芳基氨基、N-烷基脲取代的烷基、N-芳基脲取代的烷基、烷基羰基氨基取代的烷基、氨基羰基取代的烷基、杂环基、杂环基取代的烷基、杂环基取代的氨基、羧基烷基取代的芳烷基、氧代碳环稠合的芳基和杂环基烷基、环烯基、芳基取代的烷基和芳烷基、羟基取代的烷基、烷氧基取代的烷基、芳烷氧基取代的烷基、烷氧基取代的烷基、芳烷氧基取代的烷基、氨基取代的烷基、(芳基取代的烷氧羰基氨基)取代的烷基、巯基取代的烷基、烷基磺酰基取代的烷基、(羟基取代的烷硫基)取代的烷基、硫代烷氧基取代的烷基、烃基酰基氨基取代的烷基、杂环基酰基氨基取代的烷基、烃基取代的杂环基酰基氨基取代的烷基、烷基磺酰基氨基取代的烷基、芳基磺酰基氨基取代的烷基、吗啉代烷基、硫代吗啉代烷基、吗啉代羰基取代的烷基、硫代吗啉代羰基取代的烷基、[N-(烷基、链烯基或链炔基)-或N,N-[二烷基、二链烯基、二链炔基或(烷基、链烯基)-氨基]羰基取代的烷基、杂环基氨基羰基、杂环基亚烷基氨基羰基、杂环基氨基羰基取代的烷基、杂环基亚烷基氨基羰基取代的烷基、N,N-[二烷基]亚烷基氨基羰基、N,N[二烷基]亚烷基氨基羰基取代的烷基、烷基取代的杂环基羰基、烷基取代的杂环羰基-烷基、羧基取代的烷基、二烷基氨基取代的酰基氨基烷基和氨基酸侧链,所述氨基酸选自精氨酸、天冬酰胺、谷氨酰胺、S-甲基半胱氨酸、甲硫氨酸及其相应的亚砜

5

2

2

3

2

98809047.3权 利 要 求 书 第5/12页

和砜衍生物、甘氨酸、亮氨酸、异亮氨酸、别-异亮氨酸、叔-酸、正亮氨酸、苯丙氨酸、酪氨酸、色氨酸、脯氨酸、丙氨酸氨酸、组氨酸、谷氨酰胺、缬氨酸、苏氨酸、丝氨酸、天冬氨β-氰基丙氨酸和别苏氨酸;alynyl和杂环基羰基、氨基羰基、基、一或二烷基氨基羰基、一或二芳基氨基羰基、烷基芳基氨基、二芳基氨基羰基、一或二酰基氨基羰基、芳族或脂族酰基选自氨基、羧基、羟基、巯基、一或二烷基氨基、一或二芳基氨烷基芳基氨基、二芳基氨基、一或二酰基氨基、烷氧基、链烯氧芳氧基、硫代烷氧基、硫代链烯氧基、硫代链炔氧基、硫代芳和杂环基的取代基选择性取代的烷基。

15.权利要求12的化合物,具有如下结构:

亮、酸酰基、基基氧氨鸟、氨羰被、、基

其中:

G是(CH),其中仅有一个CH基团中的一个氢被-(CH)-酰胺

21-622c4

-T所代替;

24

T和T是式CNOHF的有机部分,其中α和β的总和足以满

1-250-90-9αβ

足C、N和O原子的不足的价键;

酰胺是或

1

    R是氢或C烷基;

1-10

    c是0-4的整数;     X如权利要求1所定义;

14

    n是1-50的整数,当n大于1时,G、c、酰胺、R和T可

6

98809047.3权 利 要 求 书 第6/12页

以彼此地进行选择。

16.权利要求15的化合物,具有如下结构:

其中T是式C1-25N0-9O0-9HαFβ的有机部分,其中α和β的总和足以满

5

足C、N和O原子的不足的价键;T包括叔胺或季铵或有机酸;m是0-49的整数。

17.权利要求15的化合物,具有如下结构:

5

其中T是式C1-25N0-9O0-9HαFβ的有机部分,其中α和β的总和足以满

5

足C、N和O原子的不足的价键;T包括叔胺或季铵或有机酸;m是0-49的整数。

18.权利要求16和17中任意一项所述的化合物,其中的-酰胺5

-T选自:

5

7

98809047.3权 利 要 求 书 第7/12页

19.权利要求16和17中任意一项所述的化合物,其中的-酰胺5

-T选自:

20.权利要求14-16中任意一项所述的化合物,其中的T具有

21

如下有机酸之一与氨基缩合形成T-C(=O)-N(R)-时所形成的结构:甲酸、乙酸、丙炔酸、丙酸、氟乙酸、2-丁炔酸、环丙烷甲酸、丁酸、甲氧基乙酸、二氟乙酸、4-戊炔酸、环丁烷甲酸、3,3-二甲基丙烯酸、戊酸、N,N-二甲基甘氨酸、N-甲酰基-Gly-OH、乙氧基乙酸、(甲硫基)乙酸、吡咯-2-甲酸、3-糠酸、异噁唑-5-甲酸、反-3-己烯酸、三氟乙酸、己酸、Ac-Gly-OH、2-羟基-2-甲基丁酸、苯甲酸、烟酸、2-吡嗪甲酸、1-甲基-2-吡咯-甲酸、2-环戊烯-1-乙酸、环戊基乙酸,(S)-(-)-2-吡咯烷酮-5-甲酸、N-甲基-L-脯氨酸、庚酸、Ac-b-Ala-OH、2-乙基-2-羟基丁酸、2-(2-甲氧基乙氧基)乙酸、对甲苯甲酸、6-甲基烟酸、5-甲基-2-吡嗪甲酸、2,5-二甲基吡咯-3-甲酸、4-氟苯甲酸、3,5-二甲基异噁唑-4-甲酸、3-环戊基丙酸、辛

8

2

98809047.3权 利 要 求 书 第8/12页

酸、N,N-二甲基琥珀酰胺酸、苯基丙炔酸、肉桂酸、4-乙基苯甲酸、对-茴香酸、1,2,5-三甲基吡咯-3-甲酸、3-氟-4-甲基苯甲酸、Ac-DL-炔丙基甘氨酸、3-(三氟甲基)丁酸、1-哌啶丙酸、N-乙酰基脯氨酸、3,5-二氟苯甲酸、Ac-L-Val-OH、吲哚-2-甲酸、2-苯并呋喃甲酸、苯并-5-甲酸、4-正丙基苯甲酸、3-二甲氨基苯甲酸、4-乙氧基苯甲酸、4-(甲硫基)苯甲酸、N-(2-糠酰基)甘氨酸、2-(甲硫基)烟酸、3-氟-4-甲氧基苯甲酸、Tfa-Gly-OH、2-萘酸、喹哪啶酸、Ac-L-Ile-OH、3-甲基茚-2-甲酸、2-喹喔啉甲酸、l-甲基吲哚-2-甲酸、2,3,6-三氟苯甲酸、N-甲酰基-L-Met-OH、2-[2-(2-甲氧基乙氧基)乙氧基]乙酸、4-正丁基苯甲酸、N-苯甲酰基甘氨酸、5-氟吲哚-2-甲酸、4-正丙氧基苯甲酸、4-乙酰基-3,5-二甲基-2-吡咯甲酸、3,5-二甲氧基苯甲酸、2,6-二甲氧基烟酸、环己烷戊酸、2-萘乙酸、4-(1H-吡咯-1-基)苯甲酸、吲哚-3-丙酸、间三氟甲基苯甲酸、5-甲氧基吲哚-2-甲酸、4-戊基苯甲酸、Bz-b-Ala-OH、4-二乙氨基苯甲酸、4-正丁氧基苯甲酸、3-甲基-5-CF3-异噁唑-4-甲酸、(3,4-二甲氧基苯基)乙酸、4-联苯基甲酸、新戊酰-Pro-OH、辛酰-Gly-OH、(2-萘氧基)乙酸、吲哚-3-丁酸、4-(三氟甲基)苯基乙酸,5-甲氧基吲哚-3-乙酸、4-(三氟甲氧基)苯甲酸、Ac-L-Phe-OH、4-戊氧基苯甲酸、Z-Gly-OH、4-羧基-N-(呋喃-2-基甲基)吡咯烷-2-酮、3,4-二乙氧基苯甲酸、2,4-二甲基-5-CO2Et-吡咯-3-甲酸、N-(2-氟苯基)琥珀酰胺酸、3,4,5-三甲氧基苯甲酸、N-苯基邻氨基苯甲酸、3-苯氧基苯甲酸、壬酰基-Gly-OH、2-苯氧基吡啶-3-甲酸、2,5-二甲基-1-苯基吡咯-3-甲酸、反-4-(三氟甲基)肉桂酸、(5-甲基-2-苯基噁唑-4-基)乙酸、4-(2-环己烯基氧基)苯甲酸、5-甲氧基-2-甲基吲哚-3-乙酸、反-4-可替宁甲酸、Bz-5-氨基戊酸、4-己氧基苯甲酸、N-(3-甲氧基苯基)琥珀酰胺酸、Z-Sar-OH、4-(3,4-二甲氧基苯基)丁酸、Ac-o-氟-DL-Phe-OH、N-(4-氟苯基)戊酰胺酸、4’-乙基-4-联苯基甲酸、1,2,3,4-四氢吖啶甲酸、3-苯氧基苯基乙酸、N-(2,4-二氟苯基)琥珀酰胺酸、N-癸酰-Gly-OH、(+)-6-甲氧基-a-甲基-2-萘乙酸、

9

98809047.3权 利 要 求 书 第9/12页

3-(三氟甲氧基)肉桂酸、N-甲酰基-DL-Trp-OH、(R)-(+)-a-甲氧基-a-(三氟甲基)苯乙酸、Bz-DL-Leu-OH、4-(三氟甲氧基)苯氧基乙酸、4-庚氧基苯甲酸、2,3,4-三甲氧基肉桂酸、2,6-二甲氧基苯甲酰基-Gly-OH、3-(3,4,5-三甲氧基苯基)丙酸、2,3,4,5,6-五氟苯氧基乙酸、N-(2,4-二氟苯基)戊酰胺酸、N-十一酰-Gly-OH、2-(4-氟苯甲酰基)苯甲酸、5-三氟甲氧基吲哚-2-甲酸、N-(2,4-二氟苯基)二甘醇酰胺酸、Ac-L-Trp-OH、Tfa-L-苯基甘氨酸-OH、3-碘苯甲酸、3-(4-正戊基苯甲酰基)丙酸、2-苯基-4-喹啉甲酸、4-辛氧基苯甲酸、Bz-L-Met-OH、3,4,5-三乙氧基苯甲酸、N-月桂酰-Gly-OH、3,5-二(三氟甲基)苯甲酸、Ac-5-甲基-DL-Trp-OH、2-碘苯基乙酸、3-碘-4-甲基苯甲酸、3-(4-正己基苯甲酰基)丙酸、N-己酰基-L-Phe-OH、4-壬氧基苯甲酸、4’-(三氟甲基)-2-联苯基甲酸、Bz-L-Phe-OH、N-十三酰-Gly-OH、3,5-二(三氟甲基)苯乙酸、3-(4-正庚基苯甲酰基)丙酸、N-庚酰基-L-Phe-OH、4-癸氧基苯甲酸、N-(α,α,α-三氟间甲苯基)邻氨基苯甲酸、尼氟灭酸(niflumic acid)、4-(2-羟基六氟异丙基)苯甲酸、N-肉豆蔻酰基-Gly-OH、3-(4-正辛基苯甲酰基)丙酸、N-辛酰基-L-Phe-OH、4-十一烷氧基苯甲酸、3-(3,4,5-三甲氧基苯基)丙酰基-Gly-OH、8-碘萘甲酸、N-十五酰基-Gly-OH、4-十二烷氧基苯甲酸、N-棕榈酰-Gly-OH和N-硬脂酰-Gly-OH。

21.确定核酸靶中单核苷酸多态性的方法,所述方法包括: a)扩增含单核苷酸多态性的核酸靶的序列; b)产生所述靶的单链形式;

c)在足以使标记的核酸探针与互补的扩增的选定靶核酸分子杂交的条件下和时间内,将所述标记的核酸探针与扩增的靶核酸分子混合,其中所述标记与特定的单核苷酸多态性有关并可用光谱测定法或电势测定法检测;

d)通过确定大小的方法将未杂交的标记探针与杂交的标记探针分开;

10

98809047.3权 利 要 求 书 第10/12页

e)从所述探针中裂解所述标记;和

f)通过光谱测定法或滴度法检测所述标记,然后确定所述单核苷酸多态性的存在。

22.确定核酸靶中单核苷酸多态性的方法,所述方法包括: a)扩增含单核苷酸多态性的核酸靶的序列;

b)在足以使标记的核酸引物与互补的扩增的选定靶核酸分子退火的条件下和时间内,将所述标记的核酸引物与扩增的靶核酸分子混合,其中寡核苷酸引物含有与野生型序列或单核苷酸多态性互补的3’碱基,其中所述标记与特定的单核苷酸多态性有关并可用光谱测定法或电势测定法检测;

c)延伸引物,其中当所述引物的3’-碱基与所述靶互补时,合成该靶的互补链;

d)通过确定大小的方法将未延伸的标记引物与延伸的标记引物分开;

e)从所述引物或延伸的引物中裂解所述标记;和

f)通过光谱测定法或电位测定法检测所述标记,然后确定所述单核苷酸多态性的存在。

23.确定核酸群中一种特定的mRNA分子的量的方法,所述方法包括:

a)将RNA群转变成cDNA群;

b)加入含多种单核苷酸多态性的单链核酸(内部标准),所述单链核酸除有该多态性外与所述cDNA靶相同; c)扩增所述cDNA靶的特定序列;

d)共扩增所述内部标准,其中所述内部标准与cDNA扩增子的长度相同;

e)产生所述靶的单链形式;

f)在足以使标记的核酸探针与互补的选定靶cDNA和内部标准序列杂交的条件下和时间内,将该组标记的核酸探针与扩增的靶cDNA和扩增的内部标准混合,其中所述标记与特定的cDNA序列有

11

98809047.3权 利 要 求 书 第11/12页

关,并且第二标记与所述内部标准有关,并可用光谱测定法或电势测定法检测;

g)通过确定大小的方法,将未杂交的标记探针与杂交的标记探针分开;

h)将所述标记从所述探针上裂解下来; i)用光谱测定法或电势测定法检测所述标记;和

j)计算与cDNA相关的标记和与内部标准相关的标记的比率,由此确定所述cDNA的量,从而确定核酸群中特定mRNA的量。 24.确定核酸靶中单核苷酸多态性的量的方法,所述方法包括: a)扩增含单核苷酸多态性的核酸靶的序列; b)产生所述靶的单链形式;

c)在足以使标记的核酸探针与互补的扩增的选定靶核酸分子杂交的条件下和时间内,将所述标记的核酸探针与扩增的靶核酸分子混合,其中所述标记与特定的单核苷酸多态性有关并可用光谱测定法或电势测定法检测;

d)通过确定大小的方法将未杂交的标记探针与杂交的标记探针分开;

e)从所述探针上裂解所述标记;

f)通过光谱测定法或电位滴度法检测所述标记;和

j)计算与野生型多态性相关的标记和与突变型多态性相关的标记的比率,由此确定所述多态性的量。

25.权利要求21-24任意一项所述的方法,其中,标记的核酸具有如下结构:

                     T-L-X 其中, T

ms

ms

是可用质谱法检测的有机基团,含有碳,氢和氟中的至少一

ms

种,并且选择性地含有选自氧、氮、硫、磷和碘的原子; L是可以使特有的含T开的有机基团,其中含T

部分与所述化合物的其余部分经裂解分

ms

部分含有一个官能团,当对所述化合物进

12

98809047.3权 利 要 求 书 第12/12页

行质谱分析时,该官能团可以支持单离子电荷状态,并且所述官能团是叔胺、季胺或有机酸; X是核酸。

13

98809047.3

说 明 书

用于质谱分析核酸的方法和组合物

第1/205页

技术领域

本发明主要涉及用于分析核酸分子的方法和组合物,具体地讲,本发明涉及可用于各种核酸反应的标记,在所述核酸反应中需要以大小为基础分离核酸分子。 本发明的背景

核酸分子的检测和分析是生物学中最重要的技术之一。所述技术是分子生物学的核心,并在生物学的其他领域起着越来越广泛的作用。

一般而言,一类核酸反应的分析涉及以长度为基础来分离核酸分子。例如,一种被广泛使用的技术,聚合酶链反应(PCR)(参见美国专利4683195、4683202和4800159)已被广泛用于鉴定样品中的序列以及合成用于进一步操作的DNA分子。

简单地说,在PCR中,通过以几何或线性方式合成新DNA链的酶促反应来扩增DNA序列。扩增后,必须要检测和鉴定DNA序列。由于存在可能影响分析的非特异性扩增,或者需要一定纯度,通常要在检测前对PCR反应产物进行分离。以产物大小(长度)为基础进行的分离能得到最有用的信息。对核酸分子来说,分辨率最高的方法是电泳分离。在该方法中,将每个PCR反应物都加到适宜的凝胶上,然后施加电压。可处理的样品数受凝胶孔数的。在大多数凝胶仪器上,一份凝胶可以分离约10-份样品。因此,大量样品的处理要花费大量的人力物力。

为了得到数据,电泳分离必须与一些检测系统配合使用。核酸检测系统通常且最常用的是使用掺入型染料或放射性标记,而不太常用非放射性标记。掺入型染料如溴化乙锭使用简单。在电泳过程

14

98809047.3说 明 书 第2/205页

中将所述染料加至凝胶基质中,或电泳后将所述凝胶浸泡在含染料的溶液中。在一些情况下,可直接用肉眼观察染料,但是,最常见的,特别是对于溴化乙锭,是通过光(例如UV)来激发,从而发出荧光。尽管使用起来非常容易,但是,所述染料有一些显著的缺点。首先,所述染料是不灵敏的,因此,为了用肉眼观察产物,必须要有大量的核酸分子。其次,所述染料通常具有致突变性或致癌性。 比染料更灵敏的检测技术利用了放射性(或非放射性)标记。通常,放射性标记的核苷酸或放射性标记的引物被包含在PCR反应液中。分离后,通过放射自显影可“肉眼观察”放射性标记。尽管更灵敏,但是检测受胶片的例如相关性丧失和非线性的。通过荧光图象分析检测所述标记,可以克服这些。但是,放射性标记有安全要求、资源利用增加并要使用特定的仪器并进行人员培训。出于这些原因,已越来越普遍地使用非放射性标记。在所述系统中,核苷酸含有可用抗体或其他分子(例如配体对的其他成员)检测的标记,例如荧光团、生物素或地高辛,所述抗体或其他分子用对产色底物有反应性的酶所标记。如上所述,这些系统没有安全的问题,但是要使用通常不太稳定并可产生非特异性反应的组分,因此,会产生高背景(即低信噪比)。

本发明提供了可用于各种核酸反应的新的组合物和方法,还提供了其他有关的优点。 发明概述

简而言之,本发明提供了可用于各种配体对反应的组合物和方法,在所述配体对反应中,需要以大小为基础分离所需的分子如核酸分子。借助于本文公开内容其效果可被增强的方法的代表性实例包括PCR、示差显示法(differential display)、RNA指纹法、PCR-SSCP、寡核苷酸连接分析、核酸酶消化法(例如外切和内切核酸酶为基础的分析)和双脱氧指纹法。本文所述的方法可用于许多领域,包括例如开发临床或以研究为基础的诊断方法、确定多态性以

15

98809047.3说 明 书 第3/205页

及建立基因图谱。

一方面,本发明提供了具有下式的化合物:                         T-L-X 其中,

T是可用质谱法检测的有机基团,含有碳,氢和氟中至少其一,并且选择性地含有选自氧、氮、硫、磷和碘的原子;

L是有机基团,可以使特有的含T部分与所述化合物的其余部分经裂解分开,其中含T部分含有一个官能团,当对所述化合物进行质谱分析时,所述官能团可支持单离子电荷状态,可以是叔胺、季胺或有机酸;

X是选自亚磷酰胺和H-膦酸酯的官能团。

另一方面,本发明提供了确定核酸靶中单核苷酸多态性的方法,所述方法包括:

a)扩增含单核苷酸多态性的核酸靶的序列; b)产生所述靶的单链形式;

c)在足以使标记的核酸探针与互补的扩增的选定靶核酸分子杂交的条件下和时间内,将所述标记的核酸探针与扩增的靶核酸分子混合,其中所述标记与特定的单核苷酸多态性有关并可用光谱测定法或电势测定法检测;

d)通过确定大小的方法将未杂交的标记探针与杂交的标记探针分开;

e)从所述探针中裂解所述标记;和

f)通过光谱测定法或电势测定法检测所述标记,然后确定所述单核苷酸多态性的存在。

在另一方面,本发明提供了确定核酸靶中单核苷酸多态性的方法,所述方法包括:

a)扩增含单核苷酸多态性的核酸靶的序列;

b)在足以使标记的核酸引物与互补的扩增的选定靶核酸分子退火的条件下和时间内,将所述标记的核酸引物与扩增的靶核酸分子

16

ms

ms

ms

ms

98809047.3说 明 书 第4/205页

混合,其中寡核苷酸引物含有与野生型序列或单核苷酸多态性互补的3’碱基,其中所述标记与特定的单核苷酸多态性有关并可用光谱测定法或电势测定法检测;

c)延伸引物,其中当所述引物的3’-碱基与所述靶互补时,合成所述靶的互补链;

d)通过确定大小的方法将未延伸的标记引物与延伸的标记引物分开;

e)从所述引物或延伸的引物中裂解下所述标记;和

f)通过光谱测定法或电位滴度法检测所述标记,然后确定所述单核苷酸多态性的存在。

在另一方面,本发明提供了确定核酸群中一种特定mRNA分子的量的方法,所述方法包括: a)将RNA群转变成cDNA群;

b)加入与所述cDNA靶几乎相同、但含多种单核苷酸多态性的单链核酸(内部标准);

c)扩增所述cDNA靶的特定序列;

d)共扩增内部标准,其中所述内部标准与cDNA扩增子的长度相同;

e)产生所述靶的单链形式;

f)在足以使标记的核酸探针与扩增的靶cDNA和内部标准序列杂交的条件下和时间内,将所述标记的核酸探针与扩增的靶cDNA和内部标准混合,其中所述标记与特定的cDNA序列有关,第二标记与所述内部标准有关,并可用光谱测定法或电势测定法检测; g)通过确定大小的方法,将未杂交的标记探针与杂交的标记探针分开;

h)将所述标记从所述探针上裂解下来;

i)用光谱测定法或电势测定法检测所述标记;和

j)计算与cDNA相关的标记和与内部标准相关的标记的比例,然后确定所述cDNA的量,由此确定核酸群中特定mRNA的量。

17

98809047.3说 明 书 第5/205页

在另一方面,本发明提供了确定核酸靶中单核苷酸多态性的方法,所述方法包括:

a)扩增含单核苷酸多态性的核酸靶的序列; b)产生所述靶的单链形式;

c)在足以使标记的核酸探针与互补扩增选择的靶核酸分子杂交的条件下和时间内,将所述标记的核酸探针与扩增的靶核酸分子混合,其中所述标记与特定的单核苷酸多态性有关并可用光谱测定法或电势测定法检测;

d)通过确定大小的方法将未杂交的标记探针与杂交的标记探针分开;

e)从所述探针中裂解所述标记;

f)通过光谱测定法或电位滴度法检测所述标记;和

j)计算与野生型多态性相关的标记和与突变多态性相关的标记的比例,由此确定所述多态性的量。

在上述四种方法中,所述标记的核酸优选含有T-L-X结构,其中X是核酸,T和L如上所定义。

在本发明的一个方面,提供了鉴定核酸分子的方法,所述方法包括:(a)从一种或多种选择的靶核酸分子产生标记的核酸分子,其中标记与特定的核酸片段有关并可用非荧光光谱测定法或电势测定法检测,(b)通过大小分离标记的片段,(c)从所述标记的片段裂解下所述标记,和(d)通过非荧光光谱测定法或电势测定法检测标记,由此鉴定核酸分子。

在本发明的相关方面,提供了检测所选核酸分子的方法,所述方法包括:(a)在足以使标记的核酸探针与互补的选择的靶核酸序列杂交的条件下和时间内,将标记的核酸探针与靶核酸分子混合,(b)改变杂交的标记探针、未杂交探针或靶分子或者探针:靶杂交物的大小,(c)通过大小分离标记的探针,(d)从标记的探针裂解下标记,和(e)通过非荧光光谱测定法或电势测定法检测标记,由此检测所选的核酸分子。

18

98809047.3说 明 书 第6/205页

在另一方面,提供了确定所选生物的基因型的方法,所述方法包括(a)从选择的靶分子产生标记的核酸分子,其中标记与特定的核酸片段有关并可用非荧光光谱测定法或电势测定法检测,(b)通过序列长度分离标记的分子,(c)从标记的分子中裂解下所述标记,和(d)通过非荧光光谱测定法或电势测定法检测标记,由此确定所述生物的基因型。

在另一方面,提供了确定所选生物的基因型的方法,(a)在足以使标记的分子与靶分子杂交的条件和时间内,将标记的核酸分子与所选的靶分子混合,其中标记与特定片段相关,而且可通过非荧光光谱测定法或电势测定法检测,(b)通过序列长度分离标记的片段,(c)从标记的片段中裂解所述标记,和(d)通过非荧光光谱测定法或电势测定法检测标记,由此确定所述生物的基因型。

在本发明说明书中,应理解“生物样品”不仅包括由活生物体(例如哺乳动物、鱼、细菌、寄生虫、病毒、真菌等)中或从环境(例如空气、水或固体样品)得到的样品,还包括用人工方法或合成方法产生的生物材料(例如噬菌体文库、有机分子文库、基因组克隆池、cDNA克隆、RNA克隆等)。生物样品的代表性实例包括生物液体(例如血液、脑脊液、尿)、生物细胞(如干细胞、B或T细胞、肝细胞、成纤维细胞等)和生物组织。最后,可以确定基因型的生物体的代表性实例几乎包括任何单细胞或多细胞生物,如恒温动物、哺乳动物或脊椎动物(例如人、黑猩猩、猕猴、马、牛、猪、羊、狗、猫、大鼠和小鼠,以及来自这些生物的细胞)、细菌、寄生虫、病毒、真菌和植物。

在上述方法的各种实施方案中,本发明的核酸探针和/或分子可以通过例如连接、裂解或延伸(例如PCR)反应产生。在其它方面,核酸探针或分子可以通过非3’-标记的寡核苷酸引物(例如5’-标记的寡核苷酸引物)或双脱氧核苷酸终止子标记。

在本发明的其它实施方案中,可以在一个给定的反应中同时使用4、5、10、15、20、25、30、35、40、45、50、60、70、80、90、

19

98809047.3说 明 书 第7/205页

100、200、250、300、350、400、450或大于500种以上不同并且独特的标记分子,其中,各标记对于选定的核酸分子或片段或探针是特有的,可以分别鉴定。

在本发明的另一些实施方案中,标记可以通过荧光测定法、质谱法、红外光谱法、紫外光谱法或恒电势电流分析法(例如使用电量或电流检测器)检测。适宜光谱测定技术的代表性例子包括飞行时间质谱法、四极质谱法、磁扇形质谱法和电扇形质谱法。所述技术的具体实施方案包括离子阱质谱、电喷雾电离质谱、离子喷雾质谱、液态电离质谱、大气压电离质谱、电子电离质谱、快速原子轰击电离质谱、MALDI质谱、光致电离飞行时间质谱、激光液滴质谱、MALDI-TOF质谱、APCI质谱、毫微喷雾质谱、雾化的喷雾电离质谱、化学电离质谱、共振电离质谱、二次电离质谱和热喷雾质谱。 在本发明的又一些实施方案中,靶分子、杂交的标记探针、未杂交的探针或靶分子、探针:靶杂交物、标记的核酸探针或分子可以采用区分分子之间大小(实际的线性大小或立体大小)的方法与其它分子分离。所述方法的代表性例子包括凝胶电泳、毛细管电泳、微通道电泳、HPLC、尺寸排阻色谱法、过滤、聚丙烯酰胺凝胶电泳、液相色谱、反相尺寸排阻色谱法、离子交换色谱、反相液相色谱、脉冲场电泳、倒转电场电泳、透析和荧光激发液滴分类术。或者,可以将靶分子、杂交的标记探针、未杂交的探针或靶分子、探针:靶杂交物、标记的核酸探针或分子结合在固相载体上(例如中空纤维(Amicon Corporation Danvers,Mass.)、小珠(Polysciences,Warrington,Pa.)、磁珠(Robbin Scientific,Mountain View,Calif.)、板、皿和瓶(Corning Glass Works,Corning,N.Y.)、筛网(Becton Dickinson,Mountain View,Calif.)、屏和固体纤维(参见,Edelman等,美国专利3,843,324;Kuroda

.,美国

专利4,416,777)、膜(Millipore Corp.,Bedford,Mass.)和量尺(dipsticks))。如果第一或第二成员或暴露的核酸结合在固相载体上,则在本发明的某些实施方案中,本文公开的方法还包含从固相

20

98809047.3说 明 书 第8/205页

载体中洗除未结合物质的步骤。

在其它实施方案中,可将标记的核酸分子或探针通过化学、氧化、还原、酸分解、碱分解、酶催化、电化学、加热和光分解等方法进行裂解。在其它实施方案中,分离、裂解和检测步骤可以以连续的方式进行,例如,在一个自动化的装置上进行。

在本发明的某些实施方案中,杂交的标记探针、未杂交的探针或靶分子或探针:靶杂交物的大小可以通过如下方法之一进行改变:聚合酶延伸、连接、核酸外切酶消化、核酸内切酶消化、酶消化、位点特异性重组酶消化、连接、错配特异性核酸酶消化、甲基化特异性核酸酶消化、探针与靶的共价连接和杂交。

本文所描述的方法和组合物可用于多种用途,包括,例如鉴定PCR扩增子、RNA指纹分析、差示显示、单链构象多态性检测、双脱氧指纹分析、图和性片段长度多态性、DNA指纹分析、基因型鉴定、突变检测、寡核苷酸连接分析、序列特异性扩增、诊断、法学鉴定、发育生物学、生物学、分子医学、毒理学、动物育种。 通过参照以下详细描述和附图,本发明的这些和其它方面将更为明显。此外,以下还列出了更详细描述某些方法或组合物(例如质粒等)的各种参考文献,这些文献全文引入本文作为参考。标记的生物分子以及可以使用该生物分子的分析方法,记载于1997年1月22日递交的美国专利申请08/786,835;08/786,834和08/787,521,以及1997年7月22日递交的以上三个美国专利申请的部分继续申请,申请号为08/8,180、08/8,5和08/8,501;PCT国际公开号WO 97/27331;WO 97/27325和WO 97/27327。以上六篇美国专利申请和三篇PCT国际公开均全文引入本文作为参考。 附图概述

图1描述了化学可裂解的质谱标记的五氟苯基酯的合成流程图,用来释放带有羧基酰胺末端的标记。

图2描述了化学可裂解的质谱标记的五氟苯基酯的合成流程

21

98809047.3说 明 书 第9/205页

图,用来释放带有羧酸末端的标记。

图3-6和8描述了一套36个可被光化学裂解的质谱标记的五氟苯基酯的合成流程图。

图7描述了一套36个氨基为末端的可被光化学裂解的质谱标记的合成流程图。

图9描述了从36个相应的可被光化学裂解的质谱标记酸的五氟苯酯合成36个可被光化学裂解的质谱标记的寡核苷酸的方法。 图10描述了从36个相应的氨基为末端的可被光化学裂解的质谱标记合成36个可被光化学裂解的质谱标记的寡核苷酸的方法。 图11图示说明了通过质谱同时检测多个标记。 图12显示了α-氰基基质的质谱图。 图13描述了模块装配的标记核酸片段。

图14A-14I显示了用各种不同的缓冲溶液通过HPLC分离DNA片段。

图15是根据本发明一个实施方案的基因指纹法和差示显示系统的示图。

图16是根据本发明一个实施方案的基因指纹法和差示显示系统的示图。

图17是根据本发明一个实施方案的分析系统的示图。 图18是根据本发明一个实施方案的分析系统的示图。 图19A和19B说明了本发明的可裂解标记的制备。 图20A和20B说明了本发明的可裂解标记的制备。

图21说明了可用于制备本发明可裂解标记的中间体化合物的制备。

图22A、22B和22C说明了制备本发明的可被光裂解的质谱可检测标记的合成方法。

图23给出了用CMST标记的ODN监测基因表达的试验结果。 图24-28图示说明了本申请实施例中详细描述的亚磷酰胺化学法。

22

98809047.3说 明 书 第10/205页

发明详述

如上所述,本发明提供了用于分析核酸分子的组合物和方法,其中需要以大小为基础分离核酸分子。本发明的方法可以同时检测所感兴趣的分子,包括核酸和片段、蛋白质、肽等。

本发明提供了一类可用于基因组测量的新的标记,从而提供了与分析复杂基因组所需的测量规模相适应的检测平台。该新的标记技术优选由质谱标记组成,所述质谱标记可用标准的四极质谱检测器(MSD)用大气压化学离子化(正离子模式)检测。该技术平台使用MSD检测已知分子量的质谱标记,就像二极管阵列检测器一样。该标记可以通过使用初级支架的组合化学方法进行合成,在所述支架上附着有特定的质量调节物。标记设计成能够可逆地连接到寡核苷酸上,所述寡核苷酸既可以用作PCR的扩增引物,也可以在杂交检测中用作探针。在完成任意数量的检测步骤后,对标记/探针或标记/引物进行裂解反应,优选光裂解反应,当标记可以用质谱检测时,则将标记通过APCI电离并通过质谱确定标记的质量。该标记可用于描绘序列特征和鉴定样品。

简单地讲,一方面,本发明提供其中所研究分子或其前体通过不稳定的键连接在标记上的化合物。因此,本发明的化合物可以看作是具有如下通式:

                            T-L-X

其中T是标记部分,L是连接部分,该连接部分可以是不稳定的键或含有不稳定的键,X是所研究分子(MOI)或官能团(Lh),通过该官能团,MOI可以连接到T-L上。因此,本发明的化合物还可以通过如下更具体的通式表示:

                         T-L-MOI和T-L-Lh

基于以下将要详细描述的原因,可以有目的地使T-L-MOI化合物处于可使不稳定键断裂的条件下,从而从化合物的其余部分释放出标记部分。然后通过一种或多种分析方法对标记部分进行鉴定,

23

98809047.3说 明 书 第11/205页

由此提供有关标记部分结构的直接信息,以及(更为重要的)有关相应MOI特征的间接信息。

作为其中L是直连键的本发明代表性化合物的一个简单例子,可以参见如下结构式(i):

在结构式(i)中,T是与羰基连接的含氮多环芳香部分,X是MOI(具体地讲,是以氨基为末端的核酸片段),L是形成酰胺基团的键。正如本领域所熟知的,酰胺键不如T中的键稳定,因为酰胺键可以在酸性或碱性条件下化学裂解(断裂)而标记部分中的键不发生改变。因此可以释放出标记部分(即,含有T的裂解产物),如下所示:

                标记部分         化合物其余部分 但是,如以下示例所示,接头L可以不仅仅是直连键,可以参见如下结构式(ii)所示的本发明的另一个代表性化合物:

24

98809047.3说 明 书 第12/205页

众所周知,带有邻硝基苄胺部分的化合物(参见结构式(ii)中框起来的原子)对光不稳定,将该化合物接触特定波长的光辐射将会引起苄胺键(结构式(ii)中黑线所示的键)的选择性裂解。因此,结构式(ii)含有与结构式(i)相同的T和MOI基团,但接头含有多个原子和键,在这些键中,有一个特别不稳定的键。将结构式(ii)光解可以从化合物的其余部分释放出标记部分(含T部分),如下所示。

                标记部分           化合物其余部分 因此,本发明提供如下化合物,当其接触适宜的裂解条件时,会发生裂解反应,从而从化合物的其余部分中释放出标记部分。本发明的化合物可描述为标记部分、MOI部分(或其前体,Lh)以及将两

25

98809047.3说 明 书 第13/205页

个基团连接在一起的不稳定键。或者,本发明的化合物可以用构成该化合物的各个部分进行描述。因此,该化合物可以描述为如下标记反应物、接头反应物和MOI反应物的反应产物。

标记反应物由化学柄(chemical handle)(Th)和可变部分(Tvc)组成,因此,标记反应物具有如下通式:                           Tvc-Th

为了举例说明命名法,用结构式(iii)作为参照,该结构式给出了可用于制备结构式(ii)化合物的标记反应物。结构式(iii)的标记反应物含有标记可变部分和标记柄,如下所示:

在结构式(iii)中,标记柄(-C(=O)-A)提供了用于使标记反应物与接头反应物反应生成T-L部分的途径。结构式(iii)中的基团“A”表示羧基处于化学活泼状态,从而易于同其它柄偶联。“A”可以是,例如羟基或五氟苯氧基,也可以是其它基团。正如以下将要详细讨论的,本发明提供了大量可与标记可变部分键合的可能的标记柄。因此,标记可变部分是式T-L-X中“T”的一部分,从而也是裂解L的反应中所形成的标记部分的一部分。

正如以下将要详细讨论的,之所以称其为标记可变部分,是因为在制备各组本发明的化合物时,需要一组化合物中的各个化合物具有独特的可变部分,从而可以通过分析方法将其区分开。例如,结构式(iii)的标记可变部分可以是下组成员之一,其中,该组的成员可以通过其紫外光谱或质谱区分开:

26

98809047.3说 明 书 第14/205页

同样,接头反应物可以用其化学柄(需要至少两个,每一个均标记为Lh)来描述,所述化学柄的侧面与接头不稳定部分连接,其中的接头不稳定部分由所需的不稳定部分(L)和选择性的不稳定部分(L和L)组成,其中的选择性不稳定部分可有效地将L与柄Lh隔开,所需的不稳定部分可以提供接头不稳定部分中的不稳定键。因此,接头反应物可以看作是具有如下通式:                   Lh-L-L-L-Lh

可以参照结构式(iv)说明描述接头反应物所用的命名法,所述结构式(iv)也是从结构式(ii)的化合物中抽出的:                      结构(iv)

1

2

3

3

2

2

1

正如结构式(iv)所说明的,原子可以起到一种以上的功能。因此,在结构式(iv)中,苄基氮起化学柄的作用,使得接头反应物可以通过酰胺形成反应连接到标记反应物上,随后又作为不稳定部分L结构的必需部分,因为苄基碳氮键对光裂解特别敏感。结构式(iv)还说明了接头反应物可以含有L基团(在该情况下,为亚甲基),虽然不含L基团。同样,接头反应物还可含有L基团而不含L基团,或者含有L和L基团,或者既不含L也不含L基团。在结构式(iv)中,在羰基之后所接的基团“P”表示羰基是受保护的形式。采用该结构,标记反应物(iii)的活化羧基可以仅与接头反应物(iv)的氨基反应形成酰胺键,生成式T-L-Lh的化合物。

27

1

3

1

3

1

1

3

3

2

98809047.3说 明 书 第15/205页

MOI反应物是所研究分子的适宜活泼形式。当所研究分子是核酸片段时,适宜的MOI反应物是通过其5’羟基与磷酸二酯基连接然后与以氨基为末端的亚烷基链连接的核酸片段。该氨基然后可以与结构式(iv)的羰基反应(当然,是在对羰基脱保护以后,优选在随后将羰基针对与氨基进行的反应活化之后)使MOI与接头相连。

按照时间顺序来看,本发明是由标记反应物(含有化学标记柄和标记可变部分)、接头反应物(含有两个化学接头柄、一个所需的不稳定部分和0-2个选择性的不稳定部分)和MOI反应物(含有所研究分子部分和所需柄的化学分子)形成T-L-MOI。因此,为了形成T-L-MOI,首先将标记反应物与接头反应物反应形成T-L-Lh,然后将MOI反应物与T-L-Lh反应生成T-L-MOI,或者(次优选),首先将接头反应物与MOI反应物反应生成Lh-L-MOI,然后将Lh-L-MOI与标记反应物反应生成T-L-MOI。为了方便,可将式T-L-MOI的化合物用形成该化合物可能使用的标记反应物、接头反应物和MOI反应物的方式描述。当然,可以通过其它方法(通常是更繁琐的方法)制备同样的式T-L-MOI的化合物,这些化合物仍在本发明T-L-MOI化合物的范围内。

不论怎样,本发明提供将T-L-MOI化合物进行裂解,从而使标记部分从化合物的其余部分释放出来。标记部分至少含有标记可变部分,通常还含有标记柄的部分或所有原子、用于连接标记反应物和接头反应物的接头柄的部分或所有原子、选择性的不稳定部分L(如果T-L-MOI中存在该基团的话),并且还可能含有所需不稳定部分L的一部分,这取决于L的确切结构以及裂解化学法的性质。为了简便,可将标记部分称作含T的部分,因为T通常构成标记部分的大部分(就质量而言)。

在对本发明的一个方面做了介绍后,将对各部分T、L和X进行详细描述。以下将对某些术语进行定义,这些术语将在以下用来描述T、L和X。

本文所用术语“核酸片段”是指与选定的靶核酸分子互补的分

28

2

2

1

98809047.3说 明 书 第16/205页

子(即,与其全部或部分互补),可以是天然的、合成的或是重组产生的,包括非天然的分子,在适当情况下可以是双链或单链的形式;包括寡核苷酸(例如DNA或RNA)、引物、探针、核酸类似物(例如PNA)、由多聚酶沿5’到3’方向延伸的寡核苷酸、通过化学或酶裂解的核酸、以双脱氧终止子为末端的核酸或在3’或5’末端用可以阻止在5’或3’末端聚合的化合物封闭的核酸,以及它们的组合形式。核酸片段与选定靶核酸分子的互补通常是指在整个片段长度中表现出至少约70%的特异性碱基配对。优选核酸片段表现至少约80%的特异性碱基配对;首选至少约90%。测定错配百分数(从而可以测出特异性碱基配对的百分数)的检测方法是本领域公知的,当参照完全碱基配对的对照时,该检测方法是基于作为Tm函数的错配百分比的。 文中单独或组合使用的术语“烷基”是指含有1-10个、优选1-6个、更优选1-4个碳原子的饱和直链或支链烃基。所述基团的例子包括但不仅限于,甲基、乙基、正丙基、异丙基、正丁基、异丁基、仲丁基、叔丁基、戊基、异戊基、己基、癸基等。术语“亚烷基”是指含有1-10个、优选1-6个、更优选1-4个碳原子的饱和直链或支链二价烃基。所述基团的例子包括但不仅限于亚甲基、亚乙基(-CH2-CH2)、亚丙基等。

文中单独或组合使用的术语“链烯基”是指含有至少一个碳-碳双键的2-10个、优选2-6个、更优选2-4个碳原子的直链或支链烃基。所述基团的例子包括但不仅限于乙烯基、E-和Z-丙烯基、异丙烯基、E-和Z-丁烯基、E-和Z-异丁烯基、E-和Z-戊烯基、癸烯基等。术语“亚烯基”是指含有至少一个碳-碳双键的2-10个、优选2-6个、更优选2-4个碳原子的直链或支链二价烃基。所述基团的例子包括但不仅限于亚甲基(=CH2)、亚乙烯基(-CH=CH-)、亚丙烯基(-CH2-CH=CH-)等。

文中单独或组合使用的术语“链炔基”是指含有至少一个碳-碳叁键的2-10个、优选2-6个、更优选2-4个碳原子的直链或支链烃基。所述基团的例子包括但不仅限于乙炔基、丙炔基(炔丙基)、丁

29

98809047.3说 明 书 第17/205页

炔基、己炔基、癸炔基等。单独或组合使用的术语“亚炔基”是指含有至少一个碳-碳叁键的2-10个、优选2-6个、更优选2-4个碳原子的直链或支链二价烃基。所述基团的例子包括但不仅限于亚乙炔基(-C≡C-)、亚丙炔基(-CH2-C≡C-)等。

文中单独或组合使用的术语“环烷基”是指含有3-8个、优选3-6个碳原子的饱和碳原子的环状排列。所述环烷基的例子包括但不仅限于环丙基、环丁基、环戊基、环己基等。术语“亚环烷基”是指环烷基的二价形式。

文中单独或组合使用的术语“环烯基”是指含有4-8个、优选5或6个碳原子和一个或多个双键的环状碳环。所述环烯基的例子包括但不仅限于环戊烯基、环己烯基、环戊二烯基等。术语“亚环烯基”是指环烯基的二价形式。

术语“芳基”是指选自苯基、萘基、茚基、二氢化茚基、薁基、芴基和蒽基的碳环(完全由碳和氢组成)芳基;或选自呋喃基、噻吩基、吡啶基、吡咯基、噁唑基、噻唑基、咪唑基、吡唑基、2-吡唑啉基、吡唑烷基、异噁唑基、异噻唑基、1,2,3-噁二唑基、1,2,3-基、1,3,4-噻二唑基、哒嗪基、嘧啶基、吡嗪基、1,3,5-三嗪基、1,3,5-三硫杂环己烷基、吲嗪基、吲哚基、异吲哚基、3H-吲哚基、二氢吲哚基、苯并[b]呋喃基、2,3-二氢苯并呋喃基、苯并[b]噻吩基、1H-吲唑基、苯并咪唑基、苯并噻唑基、嘌呤基、4H-喹嗪基、喹啉基、异喹啉基、噌啉基、二氮杂萘基、喹唑啉基、喹喔啉基、1,8-萘啶基、蝶啶基、咔唑基、吖啶基、吩嗪基、吩噻嗪基和吩噁嗪基的杂环芳基。

本申请中所定义的“芳基”可以彼此地含有1-4个取代基,所述取代基彼此地选自氢、卤素、羟基、氨基、硝基、三氟甲基、三氟甲氧基、烷基、链烯基、链炔基、氰基、羧基、烷氧羰基、1,2-二氧亚乙基、烷氧基、链烯氧基或链炔氧基、烷氨基、链烯基氨基、链炔基氨基、脂族或芳族酰基、烷氧羰基氨基、烷基磺酰基氨基、吗啉代羰基氨基、硫代吗啉代羰基氨基、N-烷基胍基、芳烷

30

98809047.3说 明 书 第18/205页

基氨基磺酰基、芳烷氧基烷基;N-芳烷氧基脲;N-羟基脲;N-链烯基脲;N,N-(烷基,羟基)脲;杂环基;硫代芳氧基取代的芳基;N,N-(芳基,烷基)肼基;Ar’取代的磺酰基杂环基;芳烷基取代的杂环基团;环烷基和环烯基取代的杂环基团;环烷基稠合的芳基;芳氧基取代的烷基;杂环基氨基;脂族或芳族酰基氨基羰基;脂族或芳族酰基取代的链烯基;Ar’取代的氨基羰基氧基;Ar’,Ar’二取代的芳基;脂族或芳族酰基取代的酰基;环烷基羰基烷基;环烷基取代的氨基;芳氧基羰基烷基;二酰氨基磷酸或酯。

“Ar’”是含有1-3个取代基的以上定义的碳环或杂环芳基,所述取代基选自氢、卤素、羟基、氨基、硝基、三氟甲基、三氟甲氧基、烷基、链烯基、链炔基、1,2-二氧亚甲基、1,2-二氧亚乙基、烷氧基、链烯氧基、链炔氧基、烷氨基、链烯基氨基或链炔基氨基、烷基羰基氧基、脂族或芳族酰基、烷基羰基氨基、烷氧羰基氨基、烷基磺酰基氨基、N-烷基或N,N-二烷基脲。

术语“烷氧基”,单独或是组合使用,均指烷基醚基团,其中的术语“烷基”如上所定义。适宜烷基醚基团的例子包括但不仅限于,甲氧基、乙氧基、正丙氧基、异丙氧基、正丁氧基、异丁氧基、仲丁氧基、叔丁氧基等。

术语“链烯氧基”,单独或是组合使用,均指结构式为链烯基-O-的基团,其中的术语“链烯基”如上所定义,条件是该基团不是烯醇醚。适宜的链烯氧基的例子包括但不仅限于,烯丙氧基、E-和Z-3-甲基-2-丙烯氧基等。

术语“链炔氧基”,单独或是组合使用,均指结构式为链炔基-O-的基团,其中的术语“链炔基”如上所定义,条件是该基团不是炔醇醚。适宜的链炔氧基的例子包括但不仅限于,炔丙氧基、2-丁炔氧基等。

术语“硫代烷氧基”是指结构式为烷基-S-的硫醚基团,其中的烷基如上所定义。

术语“烷基氨基”,单独或是组合使用,均指单或二烷基取代

31

98809047.3说 明 书 第19/205页

的氨基(即结构式为烷基-NH-或(烷基)2-N-的基团),其中的术语“烷基”如上所定义。适宜的烷基氨基的例子包括但不仅限于,甲氨基、乙基氨基、丙基氨基、异丙基氨基、叔丁基氨基、N,N-二乙基氨基等。

术语“链烯基氨基”,单独或是组合使用,均指结构式为链烯基-NH-或(链烯基)2N-的基团),其中的术语“链烯基”如上所定义,条件是该基团不是烯胺。所述链烯基氨基的例子是烯丙基氨基。 术语“链炔基氨基”,单独或是组合使用,均指结构式为链炔基-NH-或(链炔基)2-N-的基团),其中的术语“链炔基”如上所定义,条件是该基团不是炔胺。所述链炔基氨基的例子是炔丙基氨基。 术语“酰胺”指-N(R)-C(=O)-或-C(=O)-N(R)-,其中R如文中所定义,包括氢以及其它基团。术语“取代的酰胺”指R不是氢,而术语“未取代的酰胺”指其中R是氢。

术语“芳氧基”,单独或是组合使用,均指结构式为芳基-O-的基团,其中的芳基如上所定义。芳氧基的例子包括但不仅限于,苯氧基、萘氧基、吡啶氧基等。

术语“芳氨基”,单独或是组合使用,均指结构式为芳基-NH-的基团,其中的芳基如上所定义。芳氨基的例子包括但不仅限于,苯氨基、萘氨基、2-、3-和4-吡啶基氨基等。

术语“芳基稠合的环烷基”,单独或是组合使用,均指与芳基共享两个相邻原子的环烷基,其中的术语“环烷基”和“芳基”如上所定义。芳基稠合的环烷基的例子是苯环稠合的环丁基。 术语“烷基羰基氨基”,单独或是组合使用,均指结构式为烷基-CONH的基团,其中的术语“烷基”如上所定义。

术语“烷氧羰基氨基”,单独或是组合使用,均指结构式为烷基-OCONH-的基团,其中的术语“烷基”如上所定义。

术语“烷基磺酰基氨基”,单独或是组合使用,均指结构式为烷基-SO2NH-的基团,其中的术语“烷基”如上所定义。

术语“芳基磺酰基氨基”,单独或是组合使用,均指结构式为

32

1

1

1

1

1

98809047.3说 明 书 第20/205页

芳基-SO2NH-的基团,其中的术语“芳基”如上所定义。 术语“N-烷基脲”,单独或是组合使用,均指结构式为烷基-NH-CO-NH-的基团,其中的术语“烷基”如上所定义。

术语“N-芳基脲”,单独或是组合使用,均指结构式为芳基-NH-CO-NH-的基团,其中的术语“芳基”如上所定义。 术语“卤素”指氟、氯、溴和碘。

术语“烃基”是指碳和氢原子的排列,其仅需一个氢原子便可形成的稳定分子。因此,烃基在一个碳原子上有一个开放的价键位点,烃基可通过该位点与其它原子结合。烷基、链烯基、环烷基等均是烃基的例子。

术语“二价烃基团”是指碳和氢原子的排列,其需要两个氢原子来形成的稳定分子。因此,该烃基在一个或两个碳原子上有两个开放的价键位点,烃基可通过该位点与其它原子结合。亚烷基、亚烯基、亚炔基、亚环烷基等均是二价烃基的例子。

术语“烃基”是指完全由碳和氢组成的任何稳定的排列,其有一个价键位点并通过该位点与其它基团连接,因此,该基团包括烷基、链烯基、链炔基、环烷基、环烯基、芳基(芳环中不含杂原子)、芳烷基、烷芳基等基团。烃基团是烃基的另一种名称。

术语“亚烃基”是指完全由碳和氢组成的任何稳定的排列,其有两个价键位点并通过该位点与其它基团连接,因此,该基团包括亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚芳基(亚芳基环中不含杂原子)、芳基亚烷基、烷基亚芳基等基团。二价烃基团是亚烃基的另一种名称。

术语“烃基-O-亚烃基”是指与氧原子结合的烃基,其中的氧原子又与亚烃基的两个价键位点之一结合,亚烃基通过其价键位点与其它基团连接。术语“烃基-S-亚烃基”、“烃基-NH-亚烃基”和“烃基-酰胺-亚烃基”具有相当的含义,其中的氧分别被硫、-NH或酰胺基团所代替。

术语N-(烃基)亚烃基是指其两个价键位点之一与氮原子键合的

33

98809047.3说 明 书 第21/205页

亚烃基,而氮原子同时又与氢和烃基键合。术语N,N-二(烃基)亚烃基是指其两个价键位点之一与氮原子键合的亚烃基,该氮原子同时又与两个烃基键合。

术语“烃基酰基-亚烃基”是指通过酰基(-C(=O)-)与亚烃基的两个价键位点之一键合的烃基。

术语“杂环烃基”和“杂环基”是指稳定的环状原子排列,所述原子包括碳原子和最多四个选自氧、氮、磷和硫的原子(称为杂原子)。该环状排列可以是3-7个原子的单环形式,或是8-11个原子的二环形式。该环可以是饱和或不饱和(包括芳环)的,并且可以选择性地与苯环稠合。环中的氮和硫原子可以是各种氧化形式,包括氮的季铵化形式。杂环烃基可以在任何能够产生稳定结构的桥环碳原子或杂原子上连接。优选的杂环烃基包括含一或两个氮杂原子的5-7元单环杂环基团。

取代的杂环烃基是指以上所定义的杂环烃基,其中至少有一个环原子与环外的给定的取代基键合。

当参照烃基和亚烃基时,术语“其中一个或多个氢原子被相等数量的氟代替的任何上述基团的衍生物”是指含有碳、氢和氟原子但不含其它原子的分子。

术语“活化的酯”是指含有易于被亲核试剂如胺、醇或硫醇亲核试剂置换的“离去基团”的酯。所述离去基团是公知的,包括但不仅限于N-羟基琥珀酰亚胺、N-羟基苯并、卤素(卤化物)、烷氧基(包括四氟苯酚酯)、硫代烷氧基等。术语“受保护的酯”是指被封闭的或不活泼的酯基。参见,例如Greene,“有机合成中的保护基”。

通过以上定义,本领域技术人员很容易理解本申请中所用的其它化学术语。术语可以单独使用或以任何组合方式使用。基团的优选和更优选的链长适用于所有的组合方式。A.标记的核酸片段的生成

如上所述,一方面,本发明提供了DNA测序的一般方案,该方

34

98809047.3说 明 书 第22/205页

案允许在每一泳道内使用16个以上的标记;通过连续检测,可以经大小分离而检测标记并读出序列,就象常规的基于荧光的测序一样。该方案可用于基于标记分子大小分离的各种DNA测序技术。以下将详细讨论适用于本发明以及核酸测序方法的适宜的标记和接头。 1.标记

本文所用的“标记”通常是指用于独特地鉴定“所研究分子”的化学部分,更具体地讲,是指标记可变部分以及任何可以在标记反应物、标记成分或标记部分内与其紧密键合的部分。因此,标记分子在裂解后,基本产生单一的裂解产物,即待分析的标记。 用于本发明的标记具有多种特性:

1)能够与其它标记区分开。这种与其它化学部分的差别可以是基于标记(特别是在裂解反应后)的色谱特性,其光谱学或电位特性或它们的某些组合形式。可用于区分标记的光谱学方法包括质谱(MS)、红外(IR)、紫外(UV)和荧光,其中优选MS、IR和UV,MS是首选的光谱学方法。电位电流滴定法是优选的电势测定法。 2)当标记的浓度为10

-22

至10摩尔时可以被检测到。

-6

3)标记带有化学柄,通过该化学柄,标记可以连接到准备用标记唯一鉴定的MOI上。可以直接连接在MOI上,或间接地通过“接头”基团连接。

4)标记对于针对其所进行的所有操作(包括与MOI连接和从MOI上裂解)以及当标记与MOI连接时对MOI进行的各种操作是化学稳定的。

5)当标记与MOI连接时,标记不明显干扰对MOI进行的操作。例如,如果标记与寡核苷酸连接,标记必需不会明显干扰对寡核苷酸进行的任何杂交或酶促反应(例如PCR测序反应)。同样,如果标记与抗体连接,则标记必需不会明显干扰抗体对抗原的识别。 准备通过某些光谱学方法或电势测定法进行检测的标记部分应具有可以增强该方法的检测灵敏度和特异性的特点。通常,标记部

35

98809047.3说 明 书 第23/205页

分能够具有这些特点,因为它们已被设计在标记可变部分中,所述可变部分通常构成标记部分的主要部分。在以下讨论中,所用词语“标记”通常是指标记部分(即含有标记可变部分的裂解产物),但也可以认为是指标记可变部分本身,因为通常正是标记部分的这一部分负责提供独特的可检测特性。在式T-L-X的化合物中,“T”部分可以含有标记可变部分。如果标记可变部分被设计为通过例如质谱进行鉴定,则T-L-X的“T”部分可以称为T。同样,含有T的T-L-X的裂解产物可以称为含T部分。以下光谱学方法和电势测定法可用于鉴定含T部分。 a.MS标记的特点

当标记可以通过质谱进行分析时(即,是MS可读标记,本文也称为MS标记或“含T部分”),标记的必要特点是可以电离。因此,设计MS可读标记时优选插入在MS电离条件下可以带有正电荷或负电荷的化学官能团。该特点可以改善离子形成的效率并产生更大的检测总灵敏度,特别是在电喷雾电离时。负载离子化电荷的化学官能团可以从T或L或从二者同时衍生。在Sunner,J.等,分析化学(Anal.Chem.)60:1300-1307(1988)中讨论了可以增加通过质谱检测的分析物相对灵敏度的因素。

有助于携带负电荷的优选的官能团是有机酸,例如苯酚的羟基、羧酸、膦酸、磷酸、四唑、磺酰脲、全氟醇和磺酸。

有助于在电离条件下携带正电荷的优选的官能团是脂族或芳族胺。可以增强MS标记可检测性的胺官能团的例子包括季铵(即,有四个均与碳原子相连的键的胺,参见Aebersold,美国专利

5,240,859)和叔胺(即,带有三个与碳原子相连的键的胺,包括例如存在于吡啶中的C=N-C基团,参见Hess等,分析生物化学(Anal.Biochem.)224:373,1995:Bures等,分析生物化学,224:3,1995)。特别优选受阻叔胺。叔胺和季铵可以是烷基或芳基。含T

ms

ms

msms

ms

ms

部分必需带有至少一种可电离的成分,但可以带有一个以上的可电离成分。优选的电荷状态是每个标记带有一个离子化成分。因此,

36

98809047.3优选每个含Tms

部分(和每个标记可变部分)仅含一个有位阻的胺或有机酸基团。

可以形成含Tms

部分的一部分的适宜含胺基团包括:

37

说 明 书 第24/205页

98809047.3说 明 书 第25/205页

通过质谱鉴定标记优选是基于标记的分子质量与电荷的比(m/z)。MS标记的优选分子质量范围从约100至2000道尔顿,优选含T部分的质量至少为约250道尔顿,更优选至少约300道尔顿,仍更优选至少约350道尔顿。质谱通常难以区分低于约200-250道尔顿的母离子(取决于具体的仪器),因此优选本发明的含T部分的质量在该范围以上。

如上所述,含T部分可以含有标记可变部分中所不含的、也就是说T本身所不含的其它原子。因此,T本身的质量可以低于约250道尔顿,只要含T部分的质量至少约为250道尔顿即可。因此,T的质量可以从15(即,甲基)至约10,000道尔顿,优选从100至约5,000道尔顿,更优选从约200至约1,000道尔顿。

当标记所含的原子具有不止一种丰度显著的同位素时,通过质谱区分标记会较为困难。因此,用于质谱鉴定的优选的T基团(T

ms

ms

ms

ms

ms

ms

ms

ms

基团)含有碳,氢和氟中至少其一,以及选择性的选自氧、氮、硫、磷和碘的原子。虽然其它原子也可以存在于T中,但它们的存在可能会使对质谱数据的分析更为困难。优选T基团仅含碳、氮和氧原子,以及氢和/或氟。

氟是选择性的原子,但优选在T基团中含有氟。显然,与氢相比,氟更重。因此,存在氟原子而不是氢原子可以使T基团具有更高的质量,从而使T基团的质量达到并超过250道尔顿,根据以上的解释,这是有利的。此外,用氟代替氢可以使含T部分具有更大的挥发性,当使用质谱作为检测方法时,分析物的挥发性大可以增强灵敏度。

T的分子式在C1-500N0-100O0-100S0-10P0-10HαFβIδ的范围内,其中α、β和δ的总和足以满足C、N、O、S和P原子不足的价键。C1-500N0-100O0-100S0-10P0-10HαFβIδ是指T

ms

ms

ms

ms

ms

ms

ms

ms

含有至少一个、并且可以含有1-500内任意

数量的碳原子,此外还选择性地含有最多100个氮原子(“N0-”是指T可以不含任何氮原子)、最多100个氧原子、最多10个硫原子和最多10个磷原子。符号α、β和δ表示T中氢、氟和碘原子的数量,

38

ms

ms

98809047.3说 明 书 第26/205页

其中这些数中的任意两个可以是零,并且这些数的总和等于C、N、O、S和P原子不足的价键的总和。优选T的分子式在C1-50N0-10O0-10HαFβ的范围内,其中α和β分别等于该部分中所含的氢和氟原子的数量。 b.IR标记的特点

通过IR检测有机化学基团有两种主要形式:拉曼散射IR和吸收IR。拉曼散射IR光谱和吸收IR光谱是互补的光谱学方法。通常,拉曼激发取决于键极化率的改变,而IR吸收取决于键偶极矩的改变。弱的IR吸收线变成了强的拉曼线,反之亦然。波数是IR光谱的特征性单位。对于IR标记,有3个具有不同应用的光谱区域:12500-4000cm的近IR,400-600cm的中IR和600-30cm的远IR。对于本文所描述的使用化合物作为标记来鉴定MOI、探针或引物的应用,优选中光谱区域。例如,羰基拉伸(1850-1750cm)可用来测定羧酸、羧酸酯和酰胺、以及烷基和芳基碳酸酯、氨基甲酸酯和酮。N-H弯曲(1750-160cm)可用来鉴定胺、铵离子和酰胺。在1400-1250cm,可以检测到R-OH弯曲以及酰胺中的C-N拉伸。在900-690cm(C-H弯曲、ArNH2的N-H弯曲)可以检测芳族的取代形式。饱和的C-H、烯烃、芳环、双键和叁键、酯、缩醛、缩酮、铵盐、N-O化合物如肟、硝基、N-氧化物和酯、偶氮、腙、醌、羧酸、酰胺和内酰胺均具有振动红外相关数据(参见Pretsch等,有机化合物结构确定的光谱数据,Springer-Verlag,New York,19)。优选的化合物包括芳族腈,该化合物在2230-2210cm有很强的腈拉伸。其它有用的化合物是芳族炔,该类化合物有很强的拉伸振动,从而在2140-2100cm之间有尖的吸收带。第三种类型的化合物是芳族叠氮化物,该类化合物在2160-2120cm区域有强的吸收带。硫氰酸酯是在2275-2263cm有强吸收的代表性化合物。 c.UV标记的特点

Scott(天然产物UV光谱的解释,Permagon Press,New York,1962)给出了有机生色团类型及其各自的UV-可见光特性的汇编。生色团是可以产生特殊光吸收的原子或原子的基团或电子。对于共轭

39

-1

-1

-1

-1

-1

-1

-1

-1

-1

-1

-1

ms

98809047.3说 明 书 第27/205页

体系中的π-π*畸峰存在经验规则(参见,Pretsch等,有机化合物结构确定的光谱数据,B65和B70页,Springer-Verlag,New York,19)。优选的化合物(带有共轭体系)应具有n→π*和π→π*跃迁。所述化合物的例子包括酸性紫7、吖啶橙、吖啶黄G、艳蓝G、刚果红、结晶紫、孔雀绿草酸盐、酸性黄、亚甲蓝、甲基橙、甲基紫B、萘酚绿B、油蓝N、油红O、4-苯基偶氮苯酚、番红O、溶剂绿3和苏丹橙G,所有这些物质均可购买到(Aldrich,Milwaukee,WI)。其它适宜的化合物列于,例如Jane,I.等,J.Chrom.323:191-225(1985)。

d.荧光标记的特点

荧光探针可以非常直接地通过其吸收和荧光发射的波长和强度进行鉴定和定量。发射光谱(荧光和磷光)比吸收光谱更为灵敏,从而可以进行更特异性的测量。其它光物理特性如激发态寿命和荧光各向异性的应用较少。最常用的强度参数是吸收的摩尔消光系数(ε)和荧光的量子产率(QY)。ε值在单一波长(通常为探针的吸收最大值)下是一定的,而QY是整个荧光光谱图内光子发射总量的衡量。荧光激发(通过吸收)通常采用窄的光学频带宽度(<20nm),而荧光检测频带宽度的变化要大得多,其范围可以从整个光谱(灵敏度最大)到窄的频带(~20nm)(分辨率最大)。每个探针分子的荧光强度与ε和QY的乘积成比例。对于目前常用的荧光团,这些参数的范围是,ε约为10,000至100,000cmM,QY为0.1-1.0。可以用作荧光标记的化合物如下:荧光素、若丹明、λ蓝470、λ绿、λ红6、λ红665、吖啶橙、propedium iodide,这些物质可以从Lambda FluorescenceCo.(Pleasant Gap,PA)购买到。荧光化合物如尼罗红、德克萨斯红、lissamine、BODIPY可以从Molecular Probes(Eugene,OR)购买到。

e.电位标记的特点

电化学检测(ECD)的原理是基于在特定的施加电压下化合物的氧化或还原反应,于是给出或接受的电子会产生可以检测的电流。

40

TM

TM-1-1

98809047.3说 明 书 第28/205页

当对某些化合物施加电势差时,分子会在工作电极表面发生分子重排并失去(氧化)或得到(还原)电子,这些化合物被称为是电子的并发生电化学反应。EC检测器在HPLC洗脱液流过的电极表面施加电压。从柱子中洗脱的电活泼(electroactive)化合物或者给出电子(氧化),或者接受电子(还原),同时产生电流峰值。重要的是,所产生的电流量取决于分析物的浓度以及施加的电压,每一化合物均有特定的开始氧化或还原的电压。目前最流行的电化学检测器是电流检测器,在该检测器中,电位保持恒定,然后测定从电化学反应中产生的电流。这种类型的光谱测定法目前称为“恒电位电流测定法”。可以从ESA,Inc.,Chelmford,MA购买到电流计。

当检测效率为100%时,专用的检测器被称为“电量检测器”。电量检测器很灵敏,在选择性和灵敏性方面有许多实用的优点,从而使这些类型的检测器可以排列使用。在电量检测器中,对于给定的分析物浓度,将信号电流作为工作电极上所施加的电势(电压)的函数作图。所得到的S形图称为电流-电压曲线或流体动力伏安图(HDV)。根据HDV可以最佳地选择施加在工作电极上的电压,从而可以最大程度地观察信号。ECD的主要优点是其在目前的亚毫微微摩尔检测水平的固有灵敏度。

大量化学物质和化合物均是电化学活性的,包括许多生物化学物质、药物和杀虫剂。在色谱同洗脱的化合物可以被有效地拆分,即使它们的半波电压(在信号最大值一半时的电压)仅相差30-60mV。

最近开发的电量检测器当在基于液相色谱的分离中用作检测器时,可以选择性地鉴定和拆分共同洗脱的化合物。因此,这些阵列的检测器在检测器中增加了另一套分离装置。目前的仪器有16个通道,在原理上这些通道仅受获取数据速率的。可以在EC排列上拆分的化合物的数量受色谱的(即受塔板计数)。但是,如果两种或多种在色谱同洗脱的化合物的半波电压相差30-60mV,该阵列就能够区分这些化合物。化合物具有电化学活性的能

41

98809047.3说 明 书 第29/205页

力取决于是否含有EC活泼基团(即,-OH、-O、-N、-S)。

可以使用电量检测器成功进行检测的化合物包括5-羟色胺、3-甲氧基-4-羟基苯基-乙二醇、尿黑酸、多巴胺、变肾上腺素、3-羟基犬尿氨酸、乙酰米诺酚(acetominophen)、3-羟基色醇、5-羟基吲哚乙酸、辛磺酸、苯酚、邻甲酚、邻苯三酚、2-硝基苯酚、4-硝基苯酚、2,4-二硝基苯酚、4,6-二硝基甲酚、3-甲基-2-硝基苯酚、2,4-二氯苯酚、2,6-二氯苯酚、2,4,5-三氯苯酚、4-氯-3-甲基苯酚、5-甲基苯酚、4-甲基-2-硝基苯酚、2-羟基苯胺、4-羟基苯胺、1,2-苯二胺、苯并儿茶素、播土隆、chlortholuron、敌草隆、异丙隆、利谷隆、methobromuron、甲氧隆、绿谷隆、灭草隆、甲硫氨酸、色氨酸、酪氨酸、4-氨基苯甲酸、4-羟基苯甲酸、4-羟基香豆酸、7-甲氧基香豆素、5,7,4’-三羟黄酮、5,6,7-三羟黄酮、咖啡酸、儿茶素、矢车菊苷、绿原酸、黄豆苷原、橡精、地奥亭、表儿茶素没食子酸盐、表儿茶素、表儿茶素没食子酸盐、丁子香酚、泽兰碱(eupatorin)、阿魏酸、非瑟酮、高良姜精、没食子酸、栀子宁、染料木黄酮、龙胆酸、桔皮苷、鸢尾配基、山柰酚、无色花青素、腾黄菌素、楝子素、桑色素、杨梅黄酮、柚皮苷、narirutin、花葵素、芍药素(peonidin)、根皮素、红车轴草素(pratensein)、原儿茶酸、鼠李亭、栎精、樱花亭、黄芩配基、东莨菪亭、丁香醛、丁香酸、柑橘黄酮、三羟乙基芦丁、伞形酮、香兰酸、1,3-二甲基四氢异喹啉、6-羟基多巴胺、r-猪毛菜醇(r-salsolinol)、N-甲基-r-猪毛菜醇、四氢异喹啉、阿米替林、阿朴吗啡、辣椒碱、利眠宁(chlordiazepoxide)、氯丙嗪、柔红霉素、地昔帕明、多塞平、多塞平、氟西汀、氟西泮、丙咪嗪、异丙肾上腺素、甲氧明、吗啡、吗啡-3-葡糖苷酸、去甲替林、奥沙西泮、去氧肾上腺素、曲米帕明、抗坏血酸、N-乙酰基5-羟色胺、3,4-二羟基苄胺、3,4-二羟基扁桃酸(DOMA)、3,4-二羟基苯乙酸(DOPAC)、3,4-二羟基苯丙氨酸(L-DOPA)、3,4-二羟基苯基乙二醇(DHPG)、3-羟基邻氨基苯甲酸、2-羟基苯乙酸(2HPAC)、4-羟基苯甲酸(4HBAC)、5-羟基吲哚-3-乙酸

42

98809047.3说 明 书 第30/205页

(5HIAA)、3-羟基犬尿氨酸、3-羟基扁桃酸、3-羟基-4-甲氧基苯乙胺、4-羟基苯乙酸(4HPAC)、4-羟基苯基乳酸(4HPLA)、5-羟基色氨酸(5HTP)、5-羟基色醇(5HTOL)、5-羟色胺(5HT)、5-羟色胺硫酸盐、3-甲氧基-4-羟基苯基乙二醇(MHPG)、5-甲氧基色胺、5-甲氧基色氨酸、5-甲氧基色醇、3-甲氧基酪胺(3MT)、3-甲氧基酪氨酸(3-OM-DOPA)、5-甲基半胱氨酸、3-甲基鸟嘌呤、蟾毒色胺、多巴胺、多巴胺-3-葡糖苷酸、多巴胺-3-硫酸盐、多巴胺-4-硫酸盐、肾上腺素、麻黄宁、叶酸、谷胱甘肽(还原态)、鸟嘌呤、鸟苷、尿黑酸(HGA)、高香草酸(HVA)、高香草醇(HVOL)、高藜芦酸、hva硫酸盐、次黄嘌呤、吲哚、吲哚-3-乙酸、吲哚-3-乳酸、犬尿氨酸、褪黑激素、变肾上腺素、N-甲基色胺、N-甲基酪胺、N,N-二甲基色胺、N,N-二甲基酪胺、去甲肾上腺素、去甲变肾上腺素、真蛸胺、吡哆醛、吡哆醛磷酸、吡哆胺、脱氧肾上腺素、色醇、色胺、酪胺、尿酸、香草扁桃酸(vma)、黄嘌呤和黄苷。其它适宜的化合物列于,例如Jane,I.等,J Chrom.323:191-225(1985)和Musch,G.等,J Chrom.348:97-110(1985)。这些化合物可以通过本领域已知的方法掺入到式T-L-X的化合物中。例如,带有羧基的化合物可以与胺、羟基等反应而在T和L之间形成酰胺、酯和其它键。

除上述特点外,不考虑所用的检测方法,优选标记具有模块化的化学结构。这有助于使用组合化学技术构建大量结构相关的标记。例如,T基团需要具有多种性质。当对含T部分进行质谱时,需要含有可以负载单离子化电荷状态的官能团(更简单地称为“质谱灵敏度增强子”基团,或MSSE)。此外,还需要其可以作为含T部分家族的成员之一,其中,家族的各成员均有不同的质量/电荷比,但在质谱仪中有大约相同的灵敏度。因此,家族中的各成员有相同的MSSE比较理想。为了产生化合物家族,已发现可以通过模块合成方案方便地生成标记反应物,从而标记部分本身可以看作是含有模块。

在形成T基团结构的一个优选的模块途径中,T具有如下结构

43

ms

ms

ms

ms

ms

98809047.3说 明 书 第31/205页

                   T-(J-T-)n-其中T是由碳以及氢、氟、碘、氧、氮、硫和磷中一种或多种元素形成的有机部分,质量为15-500道尔顿;T是由碳和一个或多个氢、氟、碘、氧、氮、硫和磷形成的有机部分,质量为50-1000道尔顿;J是直连键或诸如酰胺、酯、胺、硫基(sulfide)、醚、硫酯、二硫基(disulfide)、硫醚、脲、硫脲、氨基甲酸酯、硫代氨基甲酸酯、席夫碱、还原的席夫碱、亚胺、肟、腙、磷酸酯、膦酸酯、磷酰胺、膦酰胺、磺酸酯、磺酰胺或碳-碳键等的官能团;n是1-50的整数,当n大于1时,各T和J可以彼此地进行选择。

模块结构T-(J-T)n-提供了方便的合成T-L-X化合物家族的途径,其中,家族的各成员有不同的T基团。例如,当T是T并且各家族成员均理想地具有相同的MSSE时,T基团之一可以提供该MSSE结构。为了使家族各成员之间在T上有变化,T基团可在家族各成员之间发生改变。例如,一个家族成员可以是T=甲基,而另一个成员可以是T=乙基,又一个成员可以是T=丙基等。

为了使质量有“粗的”或大的飞跃,可以将T基团设计为能够向T-L-X加入明显的(例如1或数百)质量单元。这样的T基团可以称为分子量范围调节基团(“WRA”)。如果对单一的一套具有超出限定范围的质量的T基团进行研究,WRA是非常有用的。通过在T中掺入一个或多个WRA T基团,用单一的一套T基团便可以方便地得到具有宽质量范围的T基团。因此,举一个简单的例子来说,如果一套T基团为T提供了250-340道尔顿的质量范围,加入一个例如100道尔顿的WAR作为T基团可以使质量范围接近350-440道尔顿,尽管使用的是同一套T基团。同样,加入两个100道尔顿的MWA基团(每一个均作为T基团)可以达到450-540道尔顿的质量范围,增加加入WRA基团可以使T基团持续增加至非常大的质量范围。式T-(J-T-)n-L-X的优选化合物具有结构式RVWC-(RWRA)w-RMSSE-L-X,其中VWC是“T”基团,WRA和MSSE基团均是“T”基团。图12中举

44

2

3

2

3

ms

3

23

2

ms

ms3

2

2

ms

33

2

2

2

ms

2

3

ms

2

3

3

3

2

2

3

98809047.3说 明 书 第32/205页

ms

例说明了该结构,其代表了制备T的一种模块途径。

在式T-(J-T-)n-中,T和T优选选自烃基、烃基-O-亚烃基、烃基-S-亚烃基、烃基-NH-亚烃基、烃基-酰胺-亚烃基、N-(烃基)亚烃基、N,N-二(烃基)亚烃基、烃基酰基亚烃基;杂环烃基,其中的杂原子选自氧、氮、硫和磷;取代的杂环烃基,其中的杂原子选自氧、氮、硫和磷,取代基选自烃基、烃基-O-亚烃基、烃基-NH-亚烃基、烃基-S-亚烃基、N-(烃基)亚烃基、N,N-二(烃基)亚烃基和烃基酰基-亚烃基。此外,T和/或T可以是前述T/T所列基团的衍生物,例如一个或多个氢被氟取代的衍生物。

对于式T-(J-T-)n-,还优选T具有式-G(R)-,其中G是带有-个R取代基的C1-6亚烷基链。因此,如果G是亚乙基(-CH2-CH2-),两个亚乙基碳原子中的任何一个均可以带有R取代基,并且R选自烷基、链烯基、链炔基、环烷基、芳基稠合的环烷基、环烯基、芳基、芳烷基、芳基取代的链烯基或链炔基、环烷基取代的烷基、环烯基取代的环烷基、二芳基、烷氧基、链烯氧基、链炔氧基、芳烷氧基、芳基取代的链烯氧基或链炔氧基、烷基氨基、链烯基氨基或链炔基氨基、芳基取代的烷基氨基、芳基取代的链烯基氨基或链炔基氨基、芳氧基、芳基氨基、N-烷基脲取代的烷基、N-芳基脲取代的烷基、烷基羰基氨基取代的烷基、氨基羰基取代的烷基、杂环基、杂环基取代的烷基、杂环基取代的氨基、羧基烷基取代的芳烷基、氧代碳环稠合的芳基和杂环基烷基、环烯基、芳基取代的烷基和芳烷基、羟基取代的烷基、烷氧基取代的烷基、芳烷氧基取代的烷基、烷氧基取代的烷基、芳烷氧基取代的烷基、氨基取代的烷基、(芳基取代的烷氧羰基氨基)取代的烷基、巯基取代的烷基、烷基磺酰基取代的烷基、(羟基取代的烷硫基)取代的烷基、硫代烷氧基取代的烷基、烃基酰基氨基取代的烷基、杂环基酰基氨基取代的烷基、烃基取代的杂环基酰基氨基取代的烷基、烷基磺酰基氨基取代的烷基、芳基磺酰基氨基取代的烷基、吗啉代烷基、硫代吗啉代烷基、吗啉代羰基取代的烷基、硫代吗啉代羰基取代的烷基、[N-(烷基、链烯

45

2

2

2

2

3

3

2

2

3

2

3

2

3

2

3

98809047.3说 明 书 第33/205页

基或链炔基)-或N,N-[二烷基、二链烯基、二链炔基或(烷基、链烯基)-氨基]羰基取代的烷基、杂环基氨基羰基、杂环基亚烷基氨基羰基、杂环基氨基羰基取代的烷基、杂环基亚烷基氨基羰基取代的烷基、N,N-[二烷基]亚烷基氨基羰基、N,N[二烷基]亚烷基氨基羰基取代的烷基、烷基取代的杂环基羰基、烷基取代的杂环基羰基-烷基、羧基取代的烷基、二烷基氨基取代的酰基氨基烷基和氨基酸侧链,所述氨基酸选自精氨酸、天冬酰胺、谷氨酰胺、S-甲基半胱氨酸、甲硫氨酸及其相应的亚砜和砜衍生物、甘氨酸、亮氨酸、异亮氨酸、别异亮氨酸、叔亮氨酸、正亮氨酸、苯丙氨酸、酪氨酸、色氨酸、脯氨酸、丙氨酸、鸟氨酸、组氨酸、谷氨酰胺、缬氨酸、苏氨酸、丝氨酸、天冬氨酸、β-氰基丙氨酸和别苏氨酸;alynyl和杂环基羰基、氨基羰基、酰氨基、一或二烷基氨基羰基、一或二芳基氨基羰基、烷基芳基氨基羰基、二芳基氨基羰基、一或二酰基氨基羰基、芳族或脂族酰基、被选自氨基、羧基、羟基、巯基、一或二烷基氨基、一或二芳基氨基、烷基芳基氨基、二芳基氨基、一或二酰基氨基、烷氧基、链烯氧基、芳氧基、硫代烷氧基、硫代链烯氧基、硫代链炔氧基、硫代芳氧基和杂环基的取代基选择性取代的烷基。 优选的式T-(J-T-)n-L-X的化合物具有如下结构:

2

3

其中G是(CH2)1-6,其中“G”所表示CH2基团中有一个且仅有一个CH2基团的一个氢被-(CH2)c-酰胺-T所代替;T和T是式C1-25N0-9O0-9HαFβ的有机部分,其中α和β的总和足以满足C、N和O原子的不足价键;酰胺是

46

4

2

4

98809047.3说 明 书 第34/205页

R是氢或C1-10烷基;c是0-4的整数;n是

1

1-50的整数,从而当n大于1时,G、c、酰胺、R和T可以彼此地进行选择。

23

在另一个优选的实施方案中,T-(J-T-)n-L-X的化合物具有如下结构:

14

其中T是式C1-25N0-9O0-9HαFβ的有机部分,其中α和β的总和足以满足

5

C、N和O原子的不足价键;T包括叔胺或季铵或有机酸;m是0-49

241

的整数,T、T、R、L和X如前所定义。

23

在另一个优选的实施方案中,T-(J-T-)n-L-X的化合物具有如下结构:

5

其中T是式C1-25N0-9O0-9HαFβ的有机部分,其中α和β的总和足以满足

5

C、N和O原子的不足价键;T包括叔胺或季铵或有机酸;m是0-49

241

的整数,T、T、c、R、“酰胺”、L和X如前所定义。

47

5

98809047.3 在以上含有T5

基团的结构中,-酰胺-T5

优选是如下之一,它们可以方便地通过将有机酸与从“G”延伸的游离氨基反应制得:

当以上化合物带有T5

基团、“G”基团带有游离羧基(或其活泼

的等同物)时,则优选以下-酰胺-T5

基团,它们可以方便地通过将适宜的有机胺与从“G”基团延伸的游离羧基反应制得:

在本发明的三个优选实施方案中,T-L-MOI具有如下结构:

48

说 明 书 第35/205页

98809047.3说 明 书 第36/205页

或结构:

或结构:

其中T和T是式C1-25N0-9O0-9S0-3P0-3HαFβIδ的有机部分,其中α、β和δ的总和足以饱和C、N、O、S和P原子的未饱和价键;G是(CH2)1-6,

4

其中各个G所表示CH2基团中有一个且仅有一个氢被-(CH2)c-酰胺-T所代替;酰胺是

24

R是氢或C1-10烷基;c是0-4的整数;

49

1

98809047.3说 明 书 第37/205页

“C2-C10”表示含有2-10个碳原子的亚烃基,“ODN-3’-OH”表示带有末端3’羟基的核酸片段(即,在核酸片段的非3’末端与(C1-C10)连接的核酸片段);n是1-50的整数,从而当n大于1时,G、c、酰胺、R和T可以彼此地进行选择。优选一个碳原子不同时与三个杂原子连接。

在以上含有T-C(=O)-N(R)-基团的结构中,该基团可以通过将式HN(R)-的胺与有机酸反应形成,所述有机酸选自(这些有机酸仅是举例性的,并不是对所有可能的有机酸的穷举):甲酸、乙酸、丙炔酸、丙酸、氟乙酸、2-丁炔酸、环丙烷羧酸、丁酸、甲氧基乙酸、二氟乙酸、4-戊炔酸、环丁烷羧酸、3,3-二甲基丙烯酸、戊酸、N,N-二甲基甘氨酸、N-甲酰基-Gly-OH、乙氧基乙酸、(甲硫基)乙酸、吡咯-2-甲酸、3-呋喃甲酸、异噁唑-5-甲酸、反-3-己烯酸、三氟乙酸、己酸、Ac-Gly-OH、2-羟基-2-甲基丁酸、苯甲酸、烟酸、2-吡嗪甲酸、1-甲基-2-吡咯-甲酸、2-环戊烯-1-乙酸、环戊基乙酸,(S)-(-)-2-吡咯烷酮-5-甲酸、N-甲基-L-脯氨酸、庚酸、Ac-b-Ala-OH、2-乙基-2-羟基丁酸、2-(2-甲氧基乙氧基)乙酸、对-甲苯甲酸、6-甲基烟酸、5-甲基-2-吡嗪甲酸、2,5-二甲基吡咯-3-甲酸、4-氟苯甲酸、3,5-二甲基异噁唑-4-甲酸、3-环戊基丙酸、辛酸、N,N-二甲基琥珀酰胺酸、苯基丙炔酸、肉桂酸、4-乙基苯甲酸、对茴香酸、1,2,5-三甲基吡咯-3-甲酸、3-氟-4-甲基苯甲酸、Ac-DL-炔丙基甘氨酸、3-(三氟甲基)丁酸、1-哌啶丙酸、N-乙酰基脯氨酸、3,5-二氟苯甲酸、Ac-L-Val-OH、吲哚-2-甲酸、2-苯并呋喃甲酸、苯并-5-甲酸、4-正丙基苯甲酸、3-二甲氨基苯甲酸、4-乙氧基苯甲酸、4-(甲硫基)苯甲酸、N-(2-糠酰基)甘氨酸、2-(甲硫基)烟酸、3-氟-4-甲氧基苯甲酸、Tfa-Gly-OH、2-萘甲酸、喹哪啶酸、Ac-L-Ile-OH、3-甲基茚-2-甲酸、2-喹喔啉甲酸、1-甲基吲哚-2-甲酸、2,3,6-三氟苯甲酸、N-甲酰基-L-Met-OH、2-[2-(2-甲氧基乙氧基)乙氧基]乙酸、4-正丁基苯甲酸、N-苯甲酰基甘氨酸、5-氟吲哚-2-甲酸、4-正丙氧基苯甲酸、4-乙酰基-3,5-二甲基-2-吡咯甲酸、3,5-二甲氧

50

1

2

1

1

4

98809047.3说 明 书 第38/205页

基苯甲酸、2,6-二甲氧基烟酸、环己烷戊酸、2-萘乙酸、4-(1H-吡咯-1-基)苯甲酸、吲哚-3-丙酸、间-三氟甲基苯甲酸、5-甲氧基吲哚-2-甲酸、4-戊基苯甲酸、Bz-b-Ala-OH、4-二乙氨基苯甲酸、4-正丁氧基苯甲酸、3-甲基-5-CF3-异噁唑-4-甲酸、(3,4-二甲氧基苯基)乙酸、4-联苯基甲酸、新戊酰-Pro-OH、辛酰-Gly-OH、(2-萘氧基)乙酸、吲哚-3-丁酸、4-(三氟甲基)苯基乙酸,5-甲氧基吲哚-3-乙酸、4-(三氟甲氧基)苯甲酸、Ac-L-Phe-OH、4-戊氧基苯甲酸、Z-Gly-OH、4-羧基-N-(呋喃-2-基甲基)吡咯烷-2-酮、3,4-二乙氧基苯甲酸、2,4-二甲基-5-CO2Et-吡咯-3-甲酸、N-(2-氟苯基)琥珀酰胺酸、3,4,5-三甲氧基苯甲酸、N-苯基邻氨基苯甲酸、3-苯氧基苯甲酸、壬酰基-Gly-OH、2-苯氧基吡啶-3-甲酸、2,5-二甲基-1-苯基吡咯-3-甲酸、反-4-(三氟甲基)肉桂酸、(5-甲基-2-苯基噁唑-4-基)乙酸、4-(2-环己烯基氧基)苯甲酸、5-甲氧基-2-甲基吲哚-3-乙酸、反-4-可替宁甲酸、Bz-5-氨基戊酸、4-己氧基苯甲酸、N-(3-甲氧基苯基)琥珀酰胺酸、Z-Sar-OH、4-(3,4-二甲氧基苯基)丁酸、Ac-o-氟-DL-Phe-OH、N-(4-氟苯基)戊酰胺酸、4’-乙基-4-联苯基甲酸、1,2,3,4-四氢吖啶甲酸、3-苯氧基苯基乙酸、N-(2,4-二氟苯基)琥珀酰胺酸、N-癸酰-Gly-OH、(+)-6-甲氧基-a-甲基-2-萘乙酸、3-(三氟甲氧基)肉桂酸、N-甲酰基-DL-Trp-OH、(R)-(+)-a-甲氧基-a-(三氟甲基)苯乙酸、Bz-DL-Leu-OH、4-(三氟甲氧基)苯氧基乙酸、4-庚氧基苯甲酸、2,3,4-三甲氧基肉桂酸、2,6-二甲氧基苯甲酰基-Gly-OH、3-(3,4,5-三甲氧基苯基)丙酸、2,3,4,5,6-五氟苯氧基乙酸、N-(2,4-二氟苯基)戊酰胺酸、N-十一酰-Gly-OH、2-(4-氟苯甲酰基)苯甲酸、5-三氟甲氧基吲哚-2-甲酸、N-(2,4-二氟苯基)二甘醇酰胺酸(N-(2,4-Difluorophenyl)diglycolamic acid)、Ac-L-Trp-OH、Tla-L-苯基甘氨酸-OH、3-碘苯甲酸、3-(4-正戊基苯甲酰基)丙酸、2-苯基-4-喹啉甲酸、4-辛氧基苯甲酸、Bz-L-Met-OH、3,4,5-三乙氧基苯甲酸、N-月桂酰-Gly-OH、3,5-二(三氟甲基)苯甲酸、Ac-5-甲基-DL-Trp-OH、2-碘苯基乙酸、3-碘-4-甲基苯甲酸、3-(4-正己

51

98809047.3说 明 书 第39/205页

基苯甲酰基)丙酸、N-己酰基-L-Phe-OH、4-壬氧基苯甲酸、4’-(三氟甲基)-2-联苯基甲酸、Bz-L-Phe-OH、N-十三酰-Gly-OH、3,5-二(三氟甲基)苯乙酸、3-(4-正庚基苯甲酰基)丙酸、N-庚酰基-L-Phe-OH、4-癸氧基苯甲酸、N-(α,α,α-三氟间甲苯基)邻氨基苯甲酸、尼氟灭酸(niflumic acid)、4-(2-羟基六氟异丙基)苯甲酸、N-肉豆蔻酰-Gly-OH、3-(4-正辛基苯甲酰基)丙酸、N-辛酰基-L-Phe-OH、4-十一烷氧基苯甲酸、3-(3,4,5-三甲氧基苯基)丙酰基-Gly-OH、8-碘萘甲酸、N-十五酰基-Gly-OH、4-十二烷氧基苯甲酸、N-棕榈酰-Gly-OH和N-硬脂酰-Gly-OH。这些有机酸可以从Advanced ChemTech,Louisville,KY;

Bachem Bioscience Inc.,Ton-ance,CA;Calbiochem-Novabiochem Corp.,San Diego,CA;Farchan Laboratories Inc.,Gainesville FL;LancasterSynthesis,Windharn NH和MayBridge Chemical Company(c/o RyanScientific),Columbia,SC中的一处或多处获得。这些公司的目录使用以上所用的关于酸的缩写。

f.用作标记制备方法的组合化学方法

组合化学方法是一种合成方案,该方法可以产生很大的化学物质库(参见,例如PCT申请公开号WO 94/08051)。这些组合库可以用作鉴定所研究分子(MOI)的标记。组合化学方法可以定义为系统地和重复地将一组各种结构的不同“结构单元”共价连接以产生大量不同分子实体的排列组合。结构单元可以是各种形式,天然的和合成的均可,例如亲核试剂、亲电子试剂、双烯、烷基化试剂或酰化试剂、二胺、核苷酸、氨基酸、糖、类脂、有机单体、合成子及其组合。用于连接结构单元的化学反应可以是烷基化、酰化、氧化、还原、水解、取代、消除、加成、环化、缩合等。该方法可以产生化合物库,所述化合物可以是低聚物、非低聚物或其组合。如果是低聚物,所述化合物可以是支链的、直链的或环状的。可以通过组合方法制备的低聚结构的例子包括寡肽、寡核苷酸、寡糖、聚脂、聚酯、聚酰胺、聚氨酯、聚脲、聚醚、聚(磷衍生物)如磷酸酯、膦酸酯、磷酰胺、膦酰胺、亚磷酸酯、次膦酰胺(phosphinamide)等,

52

98809047.3说 明 书 第40/205页

以及聚(硫衍生物)如砜、磺酸酯、亚硫酸酯、磺酰胺、亚磺酰胺等。 一种常见的低聚物组合库是肽组合库。最近在肽化学和分子生物学中的创新使得可以制备和使用由数千万至数亿个不同肽序列组成的库。该库可以分成三大类。该库的其中一类涉及化学合成可溶性非载体结合的肽库(例如Houghten等,自然(Nature)354:84,1991)。第二类涉及化学合成载体结合的肽库,其存在于固相载体如塑料针、树脂珠或棉花上(Geysen等,分子免疫学(Mol.Immunol.)23:709.1986;Lam等,自然354:82,1991;Eichler和Houghten,生物化学(Biochemistry)32:11035,1993)。在前两种类型中,结构单元通常是L-氨基酸、D-氨基酸、非天然的氨基酸或这些氨基酸的混合物或其组合形式。第三类使用分子生物学途径在丝状的噬菌体颗粒或质粒的表面制备肽或蛋白质(Scott和Craig,Curr.Opinion Biotech.5:40,1994)。可溶性、非载体结合的肽库似乎适于多种应用,包括用作标记。肽库中各种化学物质的所有可用成分可以通过例如全甲基化等步骤进行扩充(Ostresh等,Proc.Natl.Acad.Sci.,USA 91:11138,1994)。

肽组合库可以有许多改变形式,其中肽骨架进行了修饰和/或酰胺键被模拟基团所代替。可以使用的酰胺模拟基团包括脲、尿烷和羰基亚甲基。重构骨架使侧链从各氨基酸的酰胺氮伸出而不是从α-碳伸出,构成了被称为类肽的化合物库(Simon等,Proc.Natl.Acad.Sci.,USA :9367,1992)。

另一种常见类型的低聚物组合库是寡核苷酸组合库,其中的结构单元是天然或非天然核苷酸或多糖衍生物的某些形式,包括其中各种有机或无机基团取代磷酸酯键、氮或硫取代醚键中的氧的形式(Schneider等,生物化学(Biochem.)34:9599,1995;Freier等,药物化学杂志(J.Med.Chem.)38:344,1995;Frank,生物技术杂志(J.Biotechnology)41:259,1995;Schneider等,已公开的PCT WO 942052;Ecker等,核酸研究(核酸研究)21:1853,1993)。

53

98809047.3说 明 书 第41/205页

最近公开了组合生产非低聚物、小分子化合物库的方法(DeWitt等,Proc.Natl.Acad.Sci.USA 90:690,1993;Bunin等,Proc.Natl.Acad.Sci.USA 91:4708,1994)。适于小分子库的结构包括各种有机分子,例如杂环化合物、芳族化合物、脂环烃化合物、脂族化合物、甾族化合物、抗生素、酶抑制剂、配体、激素、药物、生物碱、阿片化合物、萜烯、卟啉、毒素、催化剂以及它们的组合形式。

g.组合合成标记的特殊方法

以下简要描述两种制备和使用另一种含胺MS标记的方法。在这两种方法中,使用组合化学的方法,可以利用固相合成来同时平行地合成大量标记的接头。在第一种方法中,最终将标记从寡核苷酸上裂解释放出羧基酰胺。在第二种方法中,标记的裂解产生羧酸。这些方法中所用的化学组分以及连接元素的缩写如下:R                = 树脂

FMOC             = 芴基甲氧羰基保护基All              = 烯丙基保护基CO2H            = 羧酸基团CONH2           = 酰胺基团NH2             = 氨基OH               = 羟基CONH             = 酰胺键COO              = 酯键

NH2-Rink-CO2H  = 4-[(α-氨基)-2,4-二甲氧基苄基]-苯氧                 基丁酸(Rink接头)OH-1MeO-CO2H    = (4-羟基甲基)苯氧基丁酸

OH-2MeO-CO2H    = (4-羟基甲基-3-甲氧基)苯氧基乙酸NH2-A-COOH      = 在侧链上带有脂族或芳族胺官能团的氨                 基酸

X1....Xn-COOH    = 具有独特分子量的一组n种不同的羧酸

54

98809047.3说 明 书 第42/205页

oligol...oligo(n)= 一组n种寡核苷酸

HBTU             = O-苯并-1-基-N,N,N’,N’-四甲基脲                 六氟磷酸盐方法1中各步骤的顺序如下:OH-2MeO-CONH-R

↓    FMOC-NH-Rink-CO2H;偶联(如HBTU)FMOC-NH-Rink-COO-2MeO-CONH-R ↓    哌啶(除去FMOC)NH2-Rink-COO-2MeO-CONH-R

FMOC-NH-A-COOH;偶联(例如HBTU)FMOC-NH-A-CONH-Rink-COO-2MeO-CONH-R ↓    哌啶(除去FMOC)NH2-A-CONH-Rink-COO-2MeO-CONH-R ↓    分为n等份

  ↓ ↓ ↓ ↓ ↓  偶联到n种不同的酸X1……Xn-COOH上X1……Xn-CONH-A-CONH-Rink-COO-2MeO-CONH-R  ↓ ↓ ↓ ↓ ↓  用1%TFA从树脂上切下标记的接头X1……Xn-CONH-A-CONH-Rink-COOH

  ↓ ↓ ↓ ↓ ↓偶联到n个寡聚体上(oligol......oligo(n))(例如             通过Pfp酯)

X1……Xn-CONH-A-CONH-Rink-CONH-oligol…oligo(n) ↓  合并标记的寡聚体 ↓  完成测序反应

↓  从测序反应中分离不同长度的片段(例如通过HPLC或CE) ↓  用25%-100%TFA从接头上切下标记X1……Xn-CONH-A-CONH ↓用质谱分析

55

98809047.3说 明 书 第43/205页

方法2中各步骤的顺序如下: OH-1MeO-CO2-All

   ↓    FMOC-NH-A-CO2H;偶联(例如,HBTU) FMOC-NH-A-COO-1MeO-CO2-All    ↓    钯(除去烯丙基) FMOC-NH-A-COO-1MeO-CO2H

   ↓  OH-2MeO-CONH-R;偶联(例如,HBTU)FMOC-NH-A-COO-1MeO-COO-2MeO-CONH-R    ↓    哌啶(除去FMOC)NH2-A-COO-1MeO-COO-2MeO-CONH-R    ↓    分成n个等份

↓ ↓ ↓ ↓ ↓  偶联到n个不同的酸X1……Xn-CO2H上X1……Xn-CONH-A-COO-1MeO-COO-2MeO-CONH-R ↓ ↓ ↓ ↓ ↓ 用1%TFA从树脂上切掉标记的接头X1……Xn-CONH-A-COO-1MeO-CO2H

 ↓ ↓ ↓ ↓ ↓偶联到n个寡聚体上(oligo1...oligo(n))(例如,通过            Pfp酯)

X1……Xn-CONH-A-COO-1MeO-CONH-oligo1…olgo(n) ↓    合并标记的寡聚体 ↓    完成测序反应

↓    从测序反应中分离不同长度的片段(例如通过HPLC或CE) ↓    用25-100%TFA从接头上切掉标记X1……Xn-CONH-A-CO2H ↓

  用质谱法分析

h.标记合成的亚磷酰胺法和相关方法

天然聚合物的固相合成最初由Merrifield(Merrifield,1963)

56

98809047.3说 明 书 第44/205页

开发用于肽化学,随后由Letsinger(Letsinger和Mahadevan 1965)将其用于寡核苷酸的合成。其概念有四个基本方面:I.在寡核苷酸与固相载体共价连接时进行合成;II.过量可溶性保护的核苷酸和偶联剂可以使反应进行到基本完全;III.反应在单一的反应容器中进行以消除由于固相载体操作引起的机械损失,从而可以用很少量的原料进行合成;IV.多相反应是标准化的,这些方法易于自动化。 合成寡核苷酸最常用的方法是亚磷酸三酯法。另一种不常使用的合成方法是H-膦酸酯法。 寡核苷酸合成的亚磷酸三酯法

该方法的开发始于1975年,自从Letsinger(Letsinger等,1975)引入了对称的亚磷酸酯试剂methoxyphosphodichloridite。尽管偶联时间大大缩短,但该化合物的缺点是太活泼,从而在室温下很难处理,并且亚磷酸酯单体即使在-10℃下也无法保存。与受保护核苷酸的反应会生成大量对称的3’-3’二聚体(Letsinger等,1982)。 1981年引入的新的亚磷酰化试剂N,N-二甲基氨基甲氧基膦(Beaucage和Caruthers 1981)不仅解决了在亚磷酰化过程中形成3’-3’二聚体的问题,而且还生成了脱氧核苷亚磷酸酯衍生物,该物质在室温下对氧和空气中的水分较为稳定。最有用的化合物是N,N-二异丙基胺(Adams等,1983,Mcbride和Caruthers 1983),该化合物可以在硅胶柱上方便地纯化并且其干粉形式在室温下是稳定的。

该方法使用的5’-保护基是二甲氧基三苯甲基(DMT)。用二氯甲烷中的三氯乙酸(1-3%w/v)处理,该基团可在不到1分钟内完全裂解。一旦保护基被除去后,游离的5’-羟基便可以与下一个核苷结构单元偶联。

与Letsinger’s方法中所用的phosphodichloridite以及Caruthers的最初研究中所用的phosphomonochloridite/四唑(Caruthers等,1980)不同,亚磷酰胺不能直接与正在延长的链上的游离5’-羟基官能团反应。它们必需首先用弱酸如四唑处理来活

57

98809047.3说 明 书 第45/205页

化。已证实四唑具有双重作用(Berner等,1990;Dahl等,1990):它可以使亚磷酰胺官能团上的二烷基氨基质子化;然后起亲核试剂的作用,生成非常活泼的tetrazolophosphane中间体。与这些脱氧核苷-亚磷酰胺试剂的偶联反应是非常迅速的(不到2分钟)并且几乎是定量的。

由于偶联反应不能在有限的时间内定量完成,因此在每一偶联步骤均会产生少量截短的序列。这些失败的反应物含有5’-羟基。如果允许这些失败的序列进一步反应,就会导致难以从序列混合物中分离产物。将剩余的游离5’-羟基通过乙酰化进行封闭已使该问题得到了很大程度的解决。该封闭步骤用强的乙酰化试剂N-乙酰基-二甲氨基吡啶鎓离子来完成,该离子可以通过将等摩尔量的乙酸酐与4-二甲氨基吡啶(DMAP)反应形成。该反应通常在0.5分钟内定量完成。用N-甲基-咪唑代替DMAP可以使寡核苷酸的生物学活性得到改善(Ferrance等,19)。

新形成的核苷酸间的亚磷酸酯键不稳定,对酸和碱裂解均很敏感。因此,在封闭后,将三价的亚磷酸三酯氧化成稳定的五价的磷酸三酯。使用碘作为温和的氧化剂在碱性四氢呋喃溶液中进行反应,用水作为氧的供体。该反应极为迅速,在30秒内定量完成。氧化反应结束了核苷酸的加成循环。除去延长链5’-末端上的二甲氧基三苯甲基并重复另一个核苷酸加成的循环可以使链持续延长。用浓氨水处理可以完成从载体上的裂解并同时完成碱基和磷酸酯的脱保护。

寡核苷酸合成的H-膦酸酯法

Todd及其合作者首先报道了核苷H-膦酸酯的用途(Hall等,1957)。此后,H-膦酸酯化学法直到1980年才被再次研究。Garegg等(1985,1986a,1986b)和Froehler等(1986a和1986b)在1985和1986年再次提出了该方法。

在该方法中,可以活化的单体是5’-DMT-碱基保护的核苷3’-氢-膦酸酯。在这些单体中,由于H-膦酸酯部分的存在使得无需对磷酸

58

98809047.3说 明 书 第46/205页

酯进行保护。

所用的碱基保护基与亚磷酸三酯方法中的相同。由于对羟基和杂上环外的胺的保护方案是相同的,因此脱保护的方案也是相同的。

H-膦酸酯合成循环。根据H-膦酸酯方法合成寡核苷酸时,在链延长的过程中没有氧化步骤。氧化是在合成结束时进行的。 H-膦酸酯合成中的偶联步骤通过有位阻的酰氯进行活化,用所形成的酸酐与游离的寡核苷酸5’-羟基末端反应,形成核苷酸间键的H-膦酸酯类似物。收率约为96-99%。据报道,新戊酰氯和1-金刚烷碳酰氯(Andurs等,1988)是最好的活化剂。但在缩合过程中观察到了缩合剂与原料之间的一些副反应,从而降低了所需化合物的收率。具体地讲,核苷3’-H-膦酸酯的预活化及随后与OH-部分的加成(这通常在聚合物载体上的合成中发生)会导致H-膦酸二酯的收率降低。另一种副反应是缩合过程中核苷酸杂环碱基的修饰(鸟嘌呤和胸腺嘧啶的酰化或亚磷酸酯化)。亚磷酰胺化学法中的封闭试剂(乙酸酐/N-甲基咪唑)不适于H-膦酸酯的方法。可以使用通过酰氯或PFPC活化的氰乙基-H-膦酸酯(Gaffney和Jones,1988)或异丙基-H-膦酸酯(Andurs等,1988)。

在序列完成后,将所有的H-膦酸酯键同时氧化成磷酸二酯键。除了用碘进行氧化外,还可以将H-膦酸酯-脱氧核糖核苷酸转变成DNA类似物如硫代磷酸酯、氨基磷酸酯或磷酸三酯(Froehler,1986c;Froehler等,1988)。该方法的优点是单体的稳定性增加、可以制备35S-标记的寡核苷酸(Stein等,1990)以及可以再利用未反应的过量活化核苷(Seliger和Rosch,1990)。H-膦酸酯可以从GlenResearch(Herndon,VA)购买到。

本发明提供易于掺入上述常规寡核苷酸合成中的标记。本发明提供用于在固相合成过程中与核酸连接的CMST标记。该CMST标记是CMST的亚磷酰胺。

本发明的方法之一涉及将CMST标记在固相合成过程中与核酸连

59

98809047.3说 明 书 第47/205页

接。具体地讲,将CMST的亚磷酰胺缩合到与载体结合的寡核苷酸上。使固相亚磷酰胺化学法适应CMST方法可以简化纯化并有助于该方法的自动化,从而增加生产能力。于是可以简便地制备标记的分子。 如上所述,寡核苷酸合成的亚磷酰胺法已经是自动化的并且应用广泛。CMST标记的亚磷酰胺提供了用CMST标记标记寡核苷酸的简便方法。根据本发明,将CMST标记的亚磷酰胺与结合在固相载体上的寡核苷酸链缩合。载体可以是可用于核酸固相合成的任何类型。多核苷可以是核糖核苷或脱氧核糖核苷磷酸二酯。此外,也可使用多核苷类似物,包括但不仅限于硫代磷酸酯、甲基磷酸酯等。 本发明的CMST亚磷酰胺可以是通式T-L-X的结构,其中T可以通过质谱检测,L是光化学接头,X是可以使多核苷偶联在固相载体上的部分。

寡核苷酸的自动合成利用亚磷酰胺化学并开发了多种亚磷酰胺试剂(例如生物素),它们利用该化学方法标记寡核苷酸(参见图24)。使该化学方法适于质量标记与固相载体结合的寡核苷酸可以简化纯化并有助于该方法的自动化,从而可增加生产能力。 图25显示了从已制得的标记酸开始的方案。 2.接头

本文所用的“接头”部分(或L)是指用于将“标记”(或T)与“所研究分子”(或MOI)通过共价化学键连接的直接的共价键或有机化学基团。此外,直连键本身或接头部分内的一个或多个键在能够将T从T-L-X化合物的其余部分(包括MOI部分)释放(或称为裂解)的条件下是可以裂解的。T中存在的标记可变部分在裂解条件下应是稳定的。优选裂解可以迅速完成;例如在数分钟内,优选在约15秒或更短的时间内完成。

通常,接头用于将一大组标记中的每一个与类似的一大组MOI中的每一个相连。通常,单一的标记-接头组合与各MOI连接(生成各种T-L-MOI),但在某些情况下,可以有一个以上的标记-接头组

60

3

2

1MS

MS

98809047.3说 明 书 第48/205页

合与MOI连接(生成各种(T-L)n-MOI)。在本发明的另一实施方案中,有两个或多个标记通过接头上的多个彼此的位点连接在一个接头上,然后,该多标记-接头组合再与各MOI连接(生成各种(T)n-L-MOI)。

在对这组标记的MOI进行了各种操作后,使用特殊的化学和/或物理条件来裂解接头中的一个或多个共价键,从而使标记从MOI上释放。可裂解的键可以是当标记、接头和MOI连接在一起时所形成的键中的一些,但也可以不是。对接头的设计在很大程度上决定了完成裂解的条件。因此,也可以通过接头特别敏感的裂解条件对接头进行鉴定。当接头是光不稳定的时(即,易于通过接触光照射裂解),该接头可以用符号L表示。同样,符号L、L、LL

enz

hv

[O]

、L

[R]

、L

elc

、L和L可分别用于表示对酸、碱、化学氧化、化学还原、

Δ

ss

酶的催化活性(或简称为“酶”)、电化学氧化或还原、升高的温度(“加热”)和硫醇交换特别敏感的接头。

某些类型的接头仅对一种类型的裂解条件不稳定,而另一些接头则对多种类型的裂解条件不稳定。此外,在可以结合多个标记(生成(T)n-L-MOI型结构)的接头中,各标记结合位点可以对不同的裂解条件不稳定。例如,在带有两个与其结合的标记的接头中,其中的一个标记可以只对碱不稳定,而另一个只对光解不稳定。 可用于本发明的接头具有多种特性:

1)接头带有化学柄(Lh),接头可以通过该化学柄与MOI连接。 2)接头带有第二个不同的化学柄(Lh),通过该化学柄可以使标记与接头连接。如果有多个标记连接在一个接头上((T)n-L-MOI型结构),则对每个标记存在分立的柄。

3)接头对于针对其所进行的所有操作是稳定的,但引起裂解从而使含T部分从化合物的其余部分(包括MOI)释放的条件除外。因此,接头在标记与接头连接、接头与MOI连接以及当标记和接头(T-L)连接在MOI上时对MOI进行的各种操作过程中是稳定的。

4)当T-L连接在MOI上时,接头不明显干扰对MOI进行的操作。

61

98809047.3说 明 书 第49/205页

例如,如果T-L与寡核苷酸连接,T-L必需不能明显干扰在寡核苷酸上进行的任何杂交或酶促反应(例如PCR)。同样,如果T-L与抗体连接,T-L必需不能明显干扰抗体对抗原的识别。

5)标记从化合物其余部分的裂解采用不会对标记的可检测性产生不利影响的物理或化学方法以高度受控的方式发生。 对于任何给定的接头,优选该接头可与多种MOI连接,并且有多种标记可与接头连接。这种灵活性的优点在于可以使T-L结合物的库在制成后便可用于多种不同组的MOI。 如上所述,优选的接头具有如下结构式                    Lh-L-L-L-Lh

其中各Lh是可用于将接头与标记反应物和所研究分子反应物连接的活泼柄。L是接头的实质部分,因为L赋予了接头不稳定性。L和L是选择性的基团,它们可以有效地隔开L与柄Lh。

L(根据定义,其比L更靠近T)用来隔开T与所需的不稳定部分L。当裂解反应会产生可能会造成含T部分的结构发生随机变化的非常活泼的物质(例如自由基)时,这种隔离是有用的。由于裂解部位与含T部分被进一步隔开,从而就使裂解部位所形成的活泼物质破坏含T部分结构的可能性下降。此外,由于L1中的原子通常会存在于含T部分中,这些L原子可以使含T部分具有理想的性质。例如,如果含T部分是含T部分,需要有位阻的胺作为含T部分结构的一部分(作为,例如MSSE)存在时,则有位阻的胺可以存在于L不稳定部分。

在另一种情况下,L和/或L可以存在于接头部分,这仅仅是因为接头的供应商选择销售带有所述L和/或L基团形式的接头。在该情况下,使用带有L和/或L基团(只要这些接头不会抑制裂解反应)的接头不会产生不利影响,即使它们可能并不会使掺有这些基团的化合物具有任何特殊的性能优势。因此,本发明允许L和/或L基团存在于接头部分中。

L和/或L基团可以是直连键(在该情况下不存在基团)、亚烃基

62

1

3

1

3

1

3

1

3

1

3

1

ms

ms

1

2

1

3

3

2

2

2

1

1

2

3

98809047.3说 明 书 第50/205页

(例如亚烷基、亚芳基、亚环烷基等)、-O-亚烃基(例如-O-CH2-,O-CH2CH(CH3)-等)或亚烃基-(O-亚烃基)w-,其中w是1到约10的整数(例如-CH2-O-Ar-、-CH2-(O-CH2CH2)4-等)。

随着固相合成的出现,出现了大量关于对特定反应条件不稳定的接头的文献。在典型的固相合成中,固相载体通过不稳定的接头与活泼位点连接,然后在活泼位点生成待合成的分子。当分子已被完全合成后,对固相载体-接头-分子构建体进行可以从固相载体上释放分子的裂解条件。已开发的用于该步骤(或者可以用于该步骤)的不稳定接头也可以用作本发明的接头反应物。

Lloyd-Williams,P.等,“会聚固相肽合成”,四面体报道(Tetrahedron Report),No.347,49(48):11065-11133(1993)对于对光照射(例如光解)、酸、碱和其它裂解条件不稳定的接头进行广泛地讨论。关于不稳定接头的其它资料来源很容易得到。 如上所述,不同的接头设计可以赋予在不同的特定物理或化学条件下的可裂解性(“不稳定性”)。可以裂解各种接头的条件的例子包括酸、碱、氧化、还原、氟化物、硫醇交换、光解或酶催化条件。

满足上列接头一般标准的可裂解接头的例子是本领域技术人员熟知的,包括Pierce(Rockford,IL)的目录中所列的。其例子包括: ● 二(琥珀酰亚氨基琥珀酸)乙二醇酯(EGS),一种可以被羟    胺(1M,37℃下3-6小时)裂解的胺反应性交联剂; ● 二琥珀酰亚氨基酒石酸酯(DST)和磺基-DST,可以被    0.015M高碘酸钠裂解的胺反应性交联剂;

● 二[2-(琥珀酰亚氨基氧羰基氧基)乙基]砜(BSOCOES)和    磺基-BSOCOES,可以被碱(pH11.6)裂解的胺反应性交联    剂;

● 1,4-二-[3’-(2’-吡啶基二硫基(丙酰氨基)丁烷]    (DPDPB),可以通过硫醇交换或还原裂解的吡啶基二硫醇    交联剂;

63

98809047.3说 明 书 第51/205页

● N-4-[(对叠氮基水杨酰氨基)-丁基]-3’-(2’-吡啶二硫基)    丙酰胺(APDP),一种可以通过硫醇交换或还原裂解的吡    啶基二硫醇交联剂;

● 二-[β-4-(叠氮基水杨酰氨基)乙基]-二硫化物,一种可以    通过硫醇交换或还原裂解的光反应性交联剂;

● N-琥珀酰亚氨基-4-(叠氮基苯基)-1,3’-二硫基丙酸酯    (SADP),一种可以通过硫醇交换或还原裂解的光反应性交    联剂;

● 磺基琥珀酰亚氨基-2-(7-叠氮基-4-甲基香豆素-3-乙酰    胺)乙基-1,3’-二硫丙酸酯(SAED),一种可以通过硫醇交    换或还原裂解的光反应性交联剂;

● 磺基琥珀酰亚氨基-2-(间叠氮基-邻硝基苯甲酰氨基)-乙    基-1,3’-二硫丙酸酯(SAND),一种可以通过硫醇交换或    还原裂解的光反应性交联剂。

可用于释放标记的其它可裂解接头和裂解条件的例子如下。甲硅烷基连接基团可以通过氟化物或酸性条件裂解。3-、4-、5-或6-取代的-2-硝基苄氧基或者2-、3-、5-或6-取代的-4-硝基苄氧基连接基团可以通过光解进行裂解。3-、4-、5-或6-取代的-2-烷氧基苯氧基或2-、3-、5-或6-取代的-4-烷氧基苯氧基连接基团可以用Ce(NH4)2(NO3)6(氧化)裂解。NCO2(尿烷)接头可以用氢氧化物(碱)、酸或LiAlH4(还原)裂解。3-戊烯基、2-丁烯基或1-丁烯基连接基团可以用O3、OsO4/IO4或KMnO4(氧化)裂解。2-[3-、4-或5-取代的呋喃基]氧基连接基团可以通过O2、Br2、MeOH或酸裂解。

裂解其它不稳定连接基团的条件包括:叔烷氧基连接基团可以通过酸裂解;甲基(二烷基)甲氧基或4-取代的-2-烷基-1,3-二氧戊环-2-基连接基团可以通过H3O裂解;2-甲硅烷基乙氧基连接基团可以通过氟化物或酸裂解;2-(X)-乙氧基(其中X=酮、酯、酰胺、氰基、NO2、硫醚、亚砜、砜)连接基团可以在碱性条件下裂解;2-、3-、4-、5-或6-取代的苄氧基连接基团可以用酸或在还原条件下裂

+

-

98809047.3说 明 书 第52/205页

解;2-丁烯氧基连接基团可以用(Ph3P3)RhCl(H)裂解;3-、4-、5-或6-取代的2-溴苯氧基连接基团可以用Li、Mg、BuLi裂解;甲硫基甲氧基连接基团可以用Hg裂解;2-(X)-乙氧基(其中X=卤素)连接基团可以用Zn或Mg裂解;2-羟基乙氧基连接基团可以通过氧化(例如用Pb(OAc)4)裂解。

优选可以通过酸或光解裂解的接头。开发的多种用于固相肽合成的对酸不稳定的接头可用于将标记与MOI连接。其中的一些接头记载于Lloyd-Williams等最近所作的综述(四面体,49:11065-11133,1993)中。一种有用的接头是基于对烷氧基苄醇,其中的两种接头4-羟基甲基苯氧基乙酸和4-(4-羟甲基-3-甲氧基苯氧基)丁酸,可从Advanced ChemTech(Louisville,KY)购买到。这两种接头均可以通过与苄醇之间的酯键连接到标记上,以及通过与羧酸之间的酰胺键连接到含胺的MOI上。通过这些分子连接的标记可以用各种浓度的三氟乙酸从MOI上释放。这些接头的裂解导致标记上羧酸的释放。将通过相关接头如2,4-二甲氧基-4’-(羧基甲氧基)二苯甲胺(可从Advanced ChemTech以FMOC保护的形式得到)连接的标记进行酸裂解导致释放的标记上羧酰胺的释放。

大部分可用于本申请的光不稳定性接头也是为了固相肽合成而开发的(参见Lloyd-Williams的综述)。这些接头通常是基于2-硝基苄酯或2-硝基苯甲酰胺。最近在文献中报道的两种光不稳定性接头的例子是4-(4-(1-Fmoc-氨基)乙基)-2-甲氧基-5-硝基苯氧基)丁酸(Holmes和Jones,有机化学杂志,60:2318-2319,1995)和3-(Fmoc-氨基)-3-(2-硝基苯基)丙酸(Brown等,分子多样性1:4-12,1995)。这两种接头均可以通过羧酸连接到MOI的胺上。标记与接头的连接是通过标记上的羧酸与接头上的胺形成酰胺来实现的。光不稳定性接头的裂解通常用波长为350nm的紫外光来进行,所用强度和时间是本领域技术人员公知的。接头的裂解导致标记上伯酰胺的释放。可被光裂解的接头的例子包括硝基苯基甘氨酸酯、外-和内-2-苯并降冰片烯基氯化物和甲磺酸酯、3-氨基-3-(2-硝基

65

2+

98809047.3说 明 书 第53/205页

苯基)丙酸。酶催化裂解的例子包括可以裂解酯键的酯酶、可以裂解磷酸二酯键的核酸酶、可以裂解肽键的蛋白酶等。

优选的接头部分具有如下所示的邻硝基苄基结构:

其中a、b、c、d或e位置上的一个碳原子被-L-X所取代,L(优选

1

为直连键)位于以上结构中N(R)的左侧。这样的接头部分对的标有

11

“a”的碳和N(R)之间的键的选择性光诱导裂解敏感。R本身对裂

1

解反应并不十分重要,但R优选选自氢和烃基。本发明提供在上述

1

结构中,-N(R)-可被-O-替换。在上述结构中,b、c、d或e位置中的一个或多个可选择性地被烷基、烷氧基、氟、氯、羟基、羧酸酯或酰胺所取代,其中,当这些基团出现时,可以彼此地进行选择。

另一种优选的带有化学柄Lh的接头部分具有如下结构:

31

其中b、c、d或e位置中的一个或多个可被氢、烷基、烷氧基、氟、

12

氯、羟基、羧酸酯或酰胺所取代,R是氢或烃基,R是-OH或者保护或活化羧酸以利于与其它部分偶联的基团。氟碳和氢氟碳基团是活化羧酸以利于与其它部分偶联的优选基团。 3.所研究分子(MOI)

66

98809047.3说 明 书 第54/205页

MOI的例子包括核酸或核酸类似物(例如PNA)、核酸的片段(即核酸片段)、合成的核酸或片段、寡核苷酸(例如DNA或RNA)、蛋白质、肽、抗体或抗体片段、受体、受体配体、配体对的成员、细胞因子、激素、寡糖、合成的有机分子、药物以及它们的组合。 优选的MOI包括核酸片段。当载体用于碱基测序时,优选的核酸片段是与载体中所存在的序列互补的引物序列。优选核酸片段在片段的非3’末端直接或间接地与标记连接;首选以片段的5’末端连接。核酸片段可购买到或基于基因数据库(例如Dib等,自然380:152-154,1996和CEPH基因型数据库,http://www.cephb.fr)和市售载体(例如Promega,Madison,WI)制备。

本文所用的MOI包括含有可用于将MOI与T-L-Lh化合物连接的官能团的MOI衍生物。例如,在5’末端带有磷酸二酯并且其中的磷酸二酯还与亚烷基胺连接的核酸片段便是MOI。这样的MOI记载于,例如美国专利4,762,779,该专利引入本文作为参考。带有内部修饰的核酸片段也是MOI。核酸片段内部修饰的例子是其中的碱基(例如腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶)被修饰成加入了活泼官能团。这种内部修饰的核酸片段可从例如Glen Research,Herndon,VA购买到。核酸片段内部修饰的另一个例子是使用非碱基的氨基磷酸酯来合成插入到核酸片段的糖和磷酸酯基团之间的修饰的磷酸二酯。非碱基的氨基磷酸酯含有活泼基团,该基团可以使含有该氨基磷酸酯衍生部分的核酸片段与另一部分如T-L-Lh化合物连接。所述非碱基的氨基磷酸酯可从例如Clonetech Laboratorues,Inc.Palo Alto,CA购买到。 4.化学柄(Lh)

化学柄是作为第一分子一部分而存在的稳定但又活泼的原子排列,该柄可与作为第二分子一部分而存在的互补的化学柄进行化学反应,从而在两个分子之间形成共价键。例如,化学柄可以是羟基,互补的化学柄可以是羧酸基团(或其活化的衍生物如氢氟芳基酯),这两个柄之间的反应形成共价键(具体地讲,是酯键)将两个分子连

67

98809047.3说 明 书 第55/205页

接在一起。

化学柄可用于大量适于将标记与接头连接以及将接头与MOI连接的共价键形成反应中。这些反应包括烷基化反应(例如,形成醚、硫醚)、酰化反应(例如,形成酯、酰胺、氨基甲酸酯、脲、硫脲)、磷酰化反应(例如,形成磷酸酯、膦酸酯、磷酰胺、膦酰胺)、磺酰化反应(例如,形成磺酸酯、磺酰胺)、缩合(例如,形成亚胺、肟、腙)、甲硅烷基化反应、二硫化物形成、通过光解形成生成活泼中间体例如氮宾或卡宾。通常,适于将标记与接头连接的柄和键形成反应也适于连接接头和MOI,反之亦然。在某些情况下,可将MOI事先进行修饰或衍生化,以提供连接接头所需的柄。

一种特别有用的连接接头和MOI的键是二硫键。该键的形成需要在接头上存在巯基(“柄”),在MOI上存在另一个巯基。温和的氧化条件便足以使两个巯基以二硫化物的形式结合在一起。二硫键的形成还可以通过使用过量适宜的二硫化物交换试剂如吡啶基二硫化物来完成。由于二硫化物的形成是可逆的,如需要,二硫键还可作为释放标记的可裂解键。这通常是在同样温和的条件下,使用过量适宜的巯基交换试剂如二硫苏糖醇来完成。

对于标记(或带有接头的标记)和寡核苷酸的连接特别有用的是酰胺键的形成。用亚磷酰胺如6-单甲氧基三苯甲基己基氰基乙基-N,N-二异丙基亚磷酰胺(可从Glenn Research,Sterling,VA得到)很容易将脂肪族伯胺柄引入到合成的寡核苷酸上。与引入的伯胺相比,天然核苷酸如腺苷和鸟苷上的胺实际是不活泼的。这种反应性的差异构成了能够与引入的伯胺而不是核苷酸的胺选择性形成酰胺和相关结合基团(例如脲、硫脲、磺酰胺)的基础。

如Molecular Probes目录(Eugene,OR)中所列,胺反应性官能团的部分例子包括活化羧酸酯、异氰酸酯、异硫氰酸酯、磺酰卤和二氯三氮烯。活泼酯是用于胺修饰的极佳试剂,因为所形成的酰胺产物非常稳定。同时,这些试剂对脂族胺有很好的反应性而对寡核苷酸的核苷酸胺反应性很低。活泼酯的例子包括N-羟基琥珀酰亚胺

68

98809047.3说 明 书 第56/205页

酯、五氟苯基酯、四氟苯基酯和对硝基苯酯。活泼酯之所以有用,是因为它们实际上可以从任何含有羧酸的分子制备。制备活泼酯的方法记载于Bodansky(肽化学原理(第二版)),Springer Verlag,London,1993。

T-L-X所示分子中的“X”基团可以作为使分子与生物分子如核酸分子连接的化学柄。在本发明的优选实施方案中,X基团是亚磷酰胺、亚磷酸三酯和H-膦酸酯之一。如果X是这三种官能团中的任意一种,则T-L-X分子可以加成到通过公知的寡核苷酸合成的亚磷酰胺(也称为亚磷酸三酯)、磷酸二酯或H-膦酸酯合成法中的任意一种方法合成的寡核苷酸的末端上。

例如,当X是亚磷酰胺基团时,T-L-X分子可以具有如下结构

X是亚磷酰胺的优选的T-L-X分子具有如下结构

在以上含有亚磷酰胺的T-L-X分子中,R一般是烷基如C1-C6烷基,或在烷基氢的位置上带有取代基的烷基,其中适宜的取代基包括氰基(CN)。因此,亚磷酰胺中的“OR”可以是OCH2CH2CN,NR2可以是N(异丙基)2,这是在亚磷酰胺化学法制备寡核苷酸中常用的两种基团。NR2还可以是,例如吗啉基团。在一个实施方案中,R是烷基或带有一个或多个选自卤素和氰基的取代基的取代烷基,NR2的两个R基团可以结合在一起形成环烷基。

T-L-X分子可以带有磷酸二酯基作为“X”,因此具有如下结构

69

98809047.3说 明 书 第57/205页

由于在大多数实验室中已用亚磷酸三酯/亚磷酰胺法代替了磷酸二酯法来合成寡核苷酸,带有磷酸二酯基的T-L-X分子在本发明中是次优选的。

合成寡核苷酸的第三种方法是利用H-膦酸酯化学法。本发明的T-L-X分子可以带有H-膦酸酯基团形式的化学柄/X基团,因此具有如下结构:

在以上H-膦酸酯基团中,R3表示三个烷基,通常在每个烷基内含有1-6个碳原子。乙基是寡核苷酸合成中所用的H-膦酸酯试剂中的常见R基团,因此也是其中X是H-膦酸酯基团的本发明T-L-X分子中的优选R基团。 5.接头连接

通常,使用一种类型的接头来连接特定的一组标记和特定的一组MOI。在本发明的优选实施方案中,可以按照同一种方法来制备所有的各种T-L-MOI结构。这在T-L-MOI结构组很大时是特别有利的,因为这样便可以使用组合化学的方法或其它类似的方法来与制备结构组。同样,使用一种类型的接头使得可以使用同一种方法来裂解所有的各种T-L-MOI结构。这对于一大组T-L-MOI结构是有利的,因为可以对一组结构以平行的、重复的和/或自动化的方式处理。 但是,在本发明的其它实施方案中,可以使用两种或多种类型的接头来将不同亚组的标记和相应亚组的MOI连接起来。在该情况

70

98809047.3说 明 书 第58/205页

下,可以使用选择性的裂解条件来彼此地裂解各接头而不裂解其它MOI亚组中所存在的接头。

有大量共价键形成反应适用于标记与接头以及接头与MOI的连接。这些反应包括烷基化反应(例如,形成醚、硫醚)、酰化反应(例如,形成酯、酰胺、氨基甲酸酯、脲、硫脲)、磷酰化反应(例如,形成磷酸酯、膦酸酯、磷酰胺、膦酰胺)、磺酰化反应(例如,形成磺酸酯、磺酰胺)、缩合反应(例如,形成亚胺、肟、腙)、甲硅烷基化反应、二硫化物形成、通过光解形成生成活泼中间体例如氮烯或碳烯。通常,适于将标记与接头连接的柄和键形成反应也适于连接接头和MOI,反之亦然。在某些情况下,可将MOI事先进行修饰或衍生化,以提供连接接头所需的柄。

一种特别有用的连接接头和MOI的键是二硫键。该键的形成需要在接头上存在巯基(“柄”),在MOI上存在另一个巯基。温和的氧化条件便足以使两个巯基以二硫化物的形式结合在一起。二硫键的形成还可以通过使用过量适宜的二硫化物交换试剂如吡啶基二硫化物来完成。由于二硫化物的形成是可逆的,如需要,二硫键还可作为释放标记的可裂解键。这通常是在同样温和的条件下,使用过量适宜的巯基交换试剂如二硫苏糖醇来完成。

对于连接标记和寡核苷酸特别有用的是酰胺键的形成。用亚磷酰胺如6-单甲氧基三苯甲基己基氰基乙基-N,N-二异丙基亚磷酰胺(可从Glenn Research,Sterling,VA得到)可很容易将脂肪族伯胺柄引入到合成的寡核苷酸上。与引入的伯胺相比,天然核苷酸如腺苷和鸟苷上的胺实际是不活泼的。这种反应性的差异构成了能够与引入的伯胺而不是核苷酸的胺选择性形成酰胺和相关结合基团(例如脲、硫脲、磺酰胺)的基础。

如Molecular Probes目录(Eugene,OR)中所列,胺反应性官能团的部分例子包括羧酸酯、异氰酸酯、异硫氰酸酯、磺酰卤和二氯三氮烯。活泼酯是用于胺修饰的极佳试剂,因为所形成的酰胺产物非常稳定。同时,这些试剂对脂族胺有很好的反应性而对寡核苷酸

71

98809047.3说 明 书 第59/205页

的核苷酸胺反应性很低。活泼酯的例子包括N-羟基琥珀酰亚胺酯、五氟苯基酯、四氟苯基酯和对硝基苯酯。活泼酯之所以有用,是因为它们实际上可以从任何含有羧基的分子制备。制备活泼酯的方法记载于Bodansky(肽化学原理(第二版)),Springer Verlag,London,1993。

有多种市售交联剂可以用作接头(例如,参见Pierce Cross-Linkers,Pierce Chemical Co.Rockford,IL)。其中有同种双官能团的胺反应性交联剂例如同双官能的亚氨酸酯和N-羟基琥珀酰亚氨基(NHS)酯。还有带有两种或多种不同活泼基团以进行连续反应的异双官能交联剂。亚氨酸酯可在碱性pH下与胺迅速反应。NHS酯在与伯胺或仲胺反应时可以生成稳定的产物。马来酰亚胺、烷基和芳基卤化物、α-卤代酰基和吡啶基二硫化物是巯基反应性的。马来酰亚胺在6.5-7.5的pH值范围内对巯基是特异性的,在碱性条件下则会变成胺反应性的。硫醚键在生理条件下是稳定的。α-卤代乙酰基交联剂包括碘代乙酰基并且对巯基是反应性的。咪唑可与碘乙酰基部分反应,但反应很慢。吡啶基二硫化物可与巯基反应形成二硫键。碳二亚胺可使羧基与酰肼的伯胺偶联形成酰基-肼键。芳基叠氮化物是光亲和试剂,它们是化学惰性的,除非与紫外光或可见光相接触。当该化合物在250-460nm下光解时,会形成活泼的芳基氮烯。该活泼的芳基氮烯是相对非特异性的。乙二醛对精氨酸的胍基部分是反应性的。

在本发明的一个典型的实施方案中,标记先与接头连接,然后标记和接头的组合再与MOI连接,生成T-L-MOI的结构。或者,同样的结构是通过首先将接头与MOI连接,然后再将接头和MOI的组合与标记连接形成的。其中的一个例子是MOI是DNA引物或寡核苷酸。在该情况下,标记通常先与接头连接,然后将T-L与DNA引物或寡核苷酸结合,然后将其用于例如测序反应。

可以使标记与MOI(例如寡核苷酸或DNA测序引物)可逆性地连接的一种有用的形式是通过化学不稳定的接头。对接头的一种优选

72

98809047.3说 明 书 第60/205页

的设计是使接头在接触挥发性有机酸如三氟乙酸(TFA)时可以被裂解。TFA与大部分MS电离方法、包括电喷雾法是兼容的。

正如以下将要详细描述的,本发明提供基因定型的方法。用于基因定型方法的组合物包括大量下式的化合物                     T-L-MOI 其中,

T是可用质谱法检测的有机基团,含有碳,氢和氟中的至少一种,并且选择性地含有选自氧、氮、硫、磷和碘的原子。式中,L是有机基团,它可以使含T部分从化合物的其余部解下来,其中含T部分含有一个官能团,当对所述化合物进行质谱分析时,所述官能团可以支持单离子化的电荷状态,该官能团选自叔胺、季胺和有机酸。式中,MOI是核酸片段,其中L与MOI的连接位置在MOI的非3’末端。在该组合物中,至少有两种化合物具有相同的T但这些分子的MOI基团具有不同的核苷酸长度。

用于基因定型方法的另一种组合物包括大量下式的化合物                       T-L-MOI 其中,

T是可用质谱法检测的有机基团,含有碳,氢和氟中的至少一种,并且选择性地含有选自氧、氮、硫、磷和碘的原子。式中,L是有机基团,它可以使含T部分从化合物的其余部解下来,其中含T部分含有一个官能团,当对所述化合物进行质谱分析时,所述官能团可以支持单离子化的电荷状态,该官能团选自叔胺、季胺和有机酸。式中,MOI是核酸片段,其中L与MOI的连接位置在MOI的非3’末端。在该组合物中,至少有两种化合物具有相同的T,但这些化合物在进行柱色谱时具有不同的洗脱时间。

可用于基因定型方法的另一种组合物包括大量下式的化合物                          T-L-MOI 其中,

T是可用质谱法检测的有机基团,含有碳,氢和氟中的至少一

73

ms

ms

ms

ms

ms

ms

ms

ms

ms

ms

ms

ms

98809047.3说 明 书 第61/205页

种,并且选择性地含有选自氧、氮、硫、磷和碘的原子。式中,L是有机基团,它可以使含T部分从化合物的其余部解下来,其中含T部分含有一个官能团,当对所述化合物进行质谱分析时,所述官能团可以支持单离子化的电荷状态,该官能团选自叔胺、季胺和有机酸。式中,MOI是核酸片段,其中L与MOI的连接位置在MOI的非3’末端。在该组合物中,没有两种具有相同MOI核苷酸长度的化合物同时还具有相同的T。

在上述组合物中,数量优选大于2,并优选大于4。此外,MOI中的核酸片段具有与载体的一部分互补的序列,其中的片段可以引发多核苷酸合成。优选各成员的T基团相差至少2amu,优选相差至少4amu。

本发明还提供含有多组化合物的组合物,每一组化合物具有如下结构式: T-L-MOI

其中T是可用质谱法检测的有机基团,含有碳,氢和氟中的至少一种,并且选择性地含有选自氧、氮、硫、磷和碘的原子。式中,L是有机基团,它可以使含T部分从化合物的其余部解下来,其中含T部分含有一个官能团,当对所述化合物进行质谱分析时,所述官能团可以支持单离子化的电荷状态,该官能团选自叔胺、季胺和有机酸。同样,式中的MOI是核酸片段,其中L与MOI的连接位置在MOI的非3’末端。在该组合物中,第一组化合物中的成员具有相同的T基团,但具有在MOI中有不同数量核苷酸的不同的MOI基团,并且在第一组内至少有十个成员,其中在各组之间,T基团相差至少2amu。其数量优选至少为3个,更优选至少为5个。

本发明还提供含有多组化合物的组合物,每一组化合物具有如下结构式:

                          T-L-MOI

其中T是可用质谱法检测的有机基团,含有碳,氢和氟中的至少一种,并且选择性地含有选自氧、氮、硫、磷和碘的原子。式中,L

74

ms

ms

ms

msms

ms

msms

ms

ms

ms

ms

98809047.3说 明 书 第62/205页

ms

是有机基团,它可以使含T部分从化合物的其余部解下来,其中含T部分含有一个官能团,当对所述化合物进行质谱分析时,所述官能团可以支持单离子化的电荷状态,该官能团选自叔胺、季胺和有机酸。式中,MOI是核酸片段,其中L与MOI的连接位置在MOI的非3’末端。在该组合物中,一组内的化合物具有相同的洗脱时间但不同的T基团。

此外,本发明还提供用于基因定型的试剂盒。该试剂盒含有多个扩增引物对,其中至少一个引物具有如下结构式:                           T-L-MOI

其中T是可用质谱法检测的有机基团,含有碳,氢和氟中的至少一种,并且选择性地含有选自氧、氮、硫、磷和碘的原子。式中,L是有机基团,它可以使含T部分从化合物的其余部解下来,其中含T部分含有一个官能团,当对所述化合物进行质谱分析时,所述官能团可以支持单离子化的电荷状态,该官能团选自叔胺、季胺和有机酸。式中,MOI是核酸片段,其中L与MOI的连接位置在MOI的非3’末端;并且各引物对与不同的部位相关。在该试剂盒中,数量优选至少为3,更优选至少为5。

如上所述,本发明提供了用于测定核酸分子序列的组合物和方法。简而言之,该方法通常包括如下步骤:(a)产生与选定的核酸分子互补的标记核酸片段(例如从核酸分子第一末端至第二末端的标记片段),其中所述标记与特定的或选定的核苷酸相关并可用各种方法中的任一种进行检测,(b)通过系列长度分离标记的片段,(c)从标记的片段中裂解标记和(d)检测所述标记,由此确定所述核酸分子的序列。以下将更详细地讨论各个方面。 B.诊断方法 1.引言

如上所述,本发明还提供了各种方法,其中用上述标记和/或接头代替传统的标记(如放射性或酶标记)以便提高给定方法的特异

75

ms

ms

ms

ms

ms

ms

98809047.3说 明 书 第63/205页

性、灵敏度,或者可同时分析的样品数。可提高的所述方法的代表性实例包括例如RNA扩增(参见,Lizardi等,Biotechnlogy 6:1197-1202,1988;Kramer等,Nature 339:401-402,19;Lomeli等,Clinical Chem.35(9):1826-1831,19;美国专利4786600)和利用LCR或聚合酶链反应(“PCR”)的DNA扩增(参见美国专利4683195,4683202和4800159)。

可将CMST技术平台用于其中大规模测量核酸的许多应用中。可将该技术平台与或不与分离或大小测定法一起使用。非大小检测法包括其中用寡核苷酸检测靶核酸中是否存在碱基改变的单核苷酸多态(SNP)分析。或者,可将HPLC或分离系统与质谱检测器(MSD)相连,其中通过大小将核酸片段分类,因此通过结合质谱标记和保留时间而鉴定序列。核酸的HPLC(Huber等,1993,Anal.Biochem.,212,p351;Huber等,1993,Nuc.Acids Res.,21,p1061;Huber等,1993,Biotechniques,16,p8)或变性HPLC(DHPLC)对于分离有一个或多个碱基对同一性差异的DNA双螺旋是一种成功的方法,因此,可用于扫描突变。用100mM乙酸四乙铵作为离子配对剂已开发了一种常规方法,其中经HPLC在烷基化无孔2.3μM聚(苯乙烯二乙烯基苯)上可成功地分离寡核苷酸(Oefner等,1994,Anal.Biochem.,223,p39)。该技术还可以分离在长度为50-200个核苷酸的范围内仅有4-8个碱基对不同的PCR产物。

DHPLC显著地加快了SNP的检索(Oefner and Underhill,Am.J.Hum.Genetics,57,A266,1995)。DHPLC技术的诸多应用包括鉴定人Y染色体上的多态现象以促进进化研究(PNAS USA,93,196-200,1996),和迅速鉴定染色体19上引起共济失调的致病突变(Cell,87,543-552,1996)。

尽管很难设计用于检测多因素疾病的遗传检测方法,但是,200多种已知的人疾病均是由单基因中的缺陷,常常是单个氨基酸残基的改变引起的(Olsen,Biotechnology:An Industry comes of age,National Aademic Press,1986)。

76

98809047.3说 明 书 第/205页

灵敏的突变检测技术对于突变筛选可提供特别的可能性。有效的遗传检测方法还可以筛选在体检时从呼吸道或膀胱剥落的细胞中的癌基因突变(Sidransky等,Science 252:706,1991)。另外,当一种未知的基因引起疾病时,检测DNA序列变体的方法可用于通过遗传连锁分析研究疾病的遗传。已经寻找了数种不同的方法,但是对于真正的广泛应用来说,没有一种是既有效又便宜的(Cotton,RGH(1997),Mutation Detection,Oxford University Press,NewYork)。通过物理、化学或酶学方法可以鉴定样品中与单核苷酸有关的突变。通常,可将用于突变检测的方法分成适用于鉴定以前未知突变的扫描技术(Fearon,1997,Science,278,p1043-1050),和设计用于检测、区别或定量分析已知序列变体的技术(Holtzman等,1997,Science,278,602-605)。

当将双螺旋部分变性时,错配的存在诱导异常行为的异源双链,已经研究出数种用于突变检测的扫描技术。将该现象用变性和温度梯度凝胶电泳研究(分别为DGGE和TGGE)。甚至在单核苷酸位置的双螺旋错配也可以部分变性,当在变性逐渐增加的变性梯度凝胶中电泳时,产生延迟迁移(Orita,Genomics 5:874,19;Kenn,Trends Genet.7:5,1991;Myers等,Nature 313:495,1985;AbraMs等,Genomics 7:463,1990;Henco等,Nucl.Acids Res.

18:6733,1990)。尽管可以检测突变,但是得不到有关突变的精确定位或突变附近序列的信息。

双螺旋中的错配碱基对化学修饰敏感。所述修饰可使链在错配位点对裂解敏感或者在随后的延伸反应中引起聚合酶停止。化学裂解技术可以鉴定达2kb的靶序列中的突变,而且可以提供有关错配核苷酸近似位置的信息(Cotton等,PNAS USA 85:4397,1988;Ganguly等,Nucl.Acids Res.18:3933,1991)。

检测DNA链中突变的另一种策略是(在合成过程中)用修饰的核苷酸取代正常核苷酸,改变产物的分子量或其它物理参数。相对于野生型序列,含有增加或减少数量的所述修饰核苷酸的链表现出电

77

98809047.3说 明 书 第65/205页

泳迁移率改变(Naylor等,Lancet 337:635,1991)。同样,该技术可以检测突变的存在,但不能定位。

所有上述技术可以确定有限的DNA片段中突变的存在,其中有些技术可以近似地确定突变在片段内的位置。但是,仍需要序列分析以便确定碱基改变的精确位置。

已经研究了许多其它技术以便分析已知的序列变体或单核苷酸多态现象。对于筛选个体和普通种群来说,有关这些可应用的分析的自动化和经济是非常重要的考虑因素。通过它们对短寡核苷酸探针与靶序列杂交的去稳定化效果可以鉴定突变(参见Wetmur,Crit.Rev.Biochem.Mol.Biol.26:227,1991)。通常,该技术,即等位基因特异性寡核苷酸杂交包括扩增靶序列,以及随后与短寡核苷酸探针杂交。寡核苷酸-连接检测方法是一种PCR为基础的筛选方法的延伸,使用ELISA为基础的检测(OLA,Nickerson等,Proc.Natl.Acad.Sci.USA 87:23,1990)以检测含靶序列的PCR产物。因此,不需要凝胶电泳和菌落杂交。

如上所述,CMST技术还提供了各种方法,其中用可裂解标记和/或接头代替传统标记(例如放射性标记、荧光标记、或酶标记),以提高给定方法的特异性、灵敏度或可同时分析的样品数。可提高的上述方法的实例包括,例如标准核酸杂交反应(参见Sambrook等,同上文)、诊断反应如循环探针技术(CPT)(参见美国专利4876187和5011769)或寡核苷酸-连接检测(OLA)(Burket等,Science 196:180,1987)。

与杂交方法结合的CMST技术可用于司法鉴定。根据DNA分析很容易推断需要亲子鉴定的个体之间的相关性。已经证明,遗传分析在骨髓移植中是非常重要的,在骨髓移植中需要鉴别相近的供体和受体细胞。现在有两种探针可用于DNA指纹法和基因定型。多态微卫星DNA探针可鉴定多种DNA序列,每个序列以不同的形式存在于不同的个体中,因此形成了比较复杂并且在个体之间高度变化的模式。VNTR探针可鉴定基因组中的单序列,但是,按照鉴定片段的大

78

98809047.3说 明 书 第66/205页

小区分,这些序列可在人群中以多达30种的不同形式存在(Bennetand Todd,1996,Ann.Rev.Genetics,30,p343-70)。

肿瘤诊断和阶段确定(Goodfellow and Wells,1995,J.Natl.Cancer Inst.,87,p1515-23)是CMST技术平台的另一应用。癌基因和其相应多态现象的检测是核酸诊断的一个重要领域。通过特异性修饰例如点突变(如在膀胱癌和结肠肿瘤中的c-K-ras癌基因)、启动子导入、基因扩增(如成神经细胞瘤中的N-myc癌基因)或染色体重排(在慢性骨髓性白血病中,染色体9上的c-abl癌基因易位到染色体22上)可以激活细胞癌基因。CMST还可用于移植分析、基因组诊断(4%的新生儿带有遗传缺陷)。在仅由单基因修饰引起的3500种遗传疾病中,仅已知约400种疾病的主要分子缺陷。可用带有可裂解标记的DNA探针检测在任何样品中是否存在微生物。 可将CMST技术平台与不同的大小确定技术结合。

各种形式的毛细管电泳(CE)(自由溶液、等速电泳、等电聚焦、聚丙烯酰胺凝胶、胶束电动“层析”)作为一种快速高分辨率地分离极少量复杂混合物的方法得到发展。与MS本身的灵敏性和选择性结合,CE-MS是一种有效的生物分析技术。在本文所述的新应用中,这两种技术的结合产生了优越的DNA测序方法,所述方法比现有的测序方法优越许多。

CE与电喷射离子化(ESI)流速之间的对应关系和二者均由溶液中的离子种类促进(并主要用于此)的事实为极有吸引力的组合提供了基础。已经描述了毛细管区域电泳(CZE)和毛细管等速电泳与基于ESI的四电极质谱仪的组合(Olivares等,Anal.Chem.59:1230,1987;Smith等,Anal.Chem.60:436,1988;Loo等,Anal.Chem.179:404,19;Edmonds等,J.Chroma.474:21,19;Loo等,J.Microcolumn Sep.1:223,19;Lee等,J.Chromatog,458:313,1988;Smith等,J.Chromatog.480:211,19;Grese等,J.Am.Chem.Soc.111:2835,19)。

最有效的DNA片段分离方法是通常以板凝胶形式进行的聚丙烯

79

98809047.3说 明 书 第67/205页

酰胺凝胶电压(PAGE)。但是,现有技术的主要是对测序反应中产生的DNA片段进行凝胶电泳需要相对长的时间。利用使用超薄凝胶的毛细管电泳可提高很多倍(10倍)。在聚丙烯酰胺凝胶电泳中,DNA片段作为长度的函数过筛和迁移,而且现已将这种方法用于CE。现用交联聚丙烯酰胺已达到每米相当数量的塔板数(10塔板/米,Cohen等,Proc.Natl.Acad.Sci.USA 85:9660,1988)。所述的CE柱可用于DNA测序。Smith和其它人(Smith等,Nuc.Acids Res.18:4417,1990)建议并联使用多个毛细管以提高生产能力。同样,Mathies和Huang(Mathies and Huang,Nature 359:167,1992)已介绍了在平行排列的毛细管上进行分离的毛细管电泳,并证实可以高处理量地进行测序(Huang等,Anal.Chem.:967,1992,Huang等,Anal.Chem.:2149,1992)。由于不用使用平行泳道,也就不用使用板凝胶。因此,人们在电泳分离时可使用管凝胶形式。Grossman(Grossman等,Genet.Anal.Tech.Appl.9:9,1992)已说明,当用管凝胶形式代替板凝形式时,有很多优点。这是由于与板凝胶相比,管形式更能散失焦耳热,这样跑得更快(快50%),大分子量DNA片段(大于1000nt)的分辨率更高。大量读序在基因组测序中是很重要的。因此,在测序中使用可裂解标记可以使使用者使用具有最大分辨率的最有效和灵敏的DNA分离方法。

使用微装配装置的基础概念是通过将泳道尺寸最小化至100微米,从而提高电泳信息密度的能力。电子工业通常使用微装配工艺以制造不到1微米的电路。毛细管阵列的现有密度受毛细管外径的。通道的微装配化产生了更高密度的排列。微装配化可以得到用玻璃纤维不可能得到的物理装配,并在芯片上将通道与其他装置直接相连。在微芯片上构建了少量装置用于分离技术。已在硅片上制造气相色谱仪(Terry等,IEEE Trans.Electron Device,ED-26:1880,1979)和液相色谱仪(Manz等,Sens.Actuators B1:249,1990),但是,这些装置未得到广泛应用。一些研究小组已报道了在微装配装置上分离荧光染料和氨基酸(Manz等,J.Chromatography

80

7

98809047.3说 明 书 第68/205页

593:253,1992,Effenhauser等,Anal.Chem.65:2637,1993)。最近,Woolley和Mathies(Woolley and Mathies,Proc,Natl.Acad.Sci.91:11348,1994)已说明可使用光刻法和化学蚀刻在玻璃底物上制造大量分离通道。用羟乙基纤维素(HEC)分离基质填充所述通道。

hybotrope用于其中标记的寡核苷酸与互补的或半互补的(即与标记ODN序列大部分,但不是完全相同)核酸片段杂交的检测和其他方法中比较有优势。在下列文献中更详细地描述了hybotrope:例如美国专利申请Nos 60/026621(1996年9月24日申请);08/719132(1996年9月24日申请);08/933924(1997年9月23日申请);O9/002051(1997年12月31日申请);和PCR国际公开WO98/13527,所有文献均全部引入本文作为参考。

Δ-Tm不作为hybotrope浓度的函数发生变化的观察结果有相当的实用性,可用于通过聚合酶进行引物延伸的DNA、RNA或核酸扩增(例如聚合酶链反应,参见,美国专利4683195;4683202和4800159,循环探针技术,NASBA)、连接(LCR,连接链反应)和RNA扩增(参见Lizardi等,Bio/Technology 6:1197,1988;Kramer等,Nature339:401,19;Lomeli等,Clin.Chem.35:1826,19;美国专利3786600)。已观察到依据0.5MLiTCA中的热熔融可以辨别wt(野生型)和mt(突变体)30聚寡核苷酸(寡核苷酸中30个相连的核苷酸),这使得可以对PCR中的引发效率进行实质性的改进。在其目前的情况下,已就聚合酶而不是特异性引发优化了PCR缓冲液。即,自引入该项技术以来,已就有助于聚合酶发挥性能而不是寡核苷酸引发特异性优化了条件。因此,目前市售的PCR缓冲液不提供或支持高水平的PCR引物杂交严谨性。

针对野生型(wt)和突变体(mt)形式的24聚寡核苷酸的熔融行为来检测市售PCR缓冲液。或者,在hybotrope溶液中完成引发,在支持聚合酶的另一种缓冲液中完成链延伸。例如,可以使用其中固相移动通过两种溶液的固相PCR。在某种适当浓度的LiTCA或TMATCA

81

98809047.3说 明 书 第69/205页

中进行引发,然后,聚合酶链反应在含聚合酶的不同PCR缓冲液中进行。还可以在hybotrope为基础的杂交溶液中完成最初几轮扩增,然后在正常的PCR缓冲液中完成剩下的各轮反应(通常,只有前几轮对于特异性是很重要的)。

使用非碱基修饰的寡核苷酸也可以提高PCR中的引发特异性(参见,例如美国专利申请号60/026621(1996年9月24日申请);08/719132(1996年9月24日申请);08/933924(1997年9月23日申请);09/002051(1997年12月31日申请);和PCR国际公开WO98/13527)。掺入到寡核苷酸中的一个非碱基取代会使HCT降低2.5℃。每24聚体含3个非碱基位点的两个寡核苷酸探针,相对于无取代对照,HCT降低8℃。HCT的这种降低显著提高了PCR反应中引发的特异性水平。这是由于在PCR前10轮中,错误的引发减少。即,非碱基取代的寡核苷酸的焓相对于未取代的引物有所提高,因此,提高了引发的特异性。引物优选6-36个碱基长并含有1-6个非碱基位点。所述非碱基位点优选由4、5、6、7或8个核苷酸分开,也可由多达12-24个核苷酸分开。取代还优选集中在引物的3’末端以确保核酸聚合酶的引物延伸特异性。

此外,PCR引物中非碱基位点与使用促进引物双螺旋具有高焓值的hybotrope盐溶液的组合显著降低了引物双螺旋的Δ-HCT。如上所述,当Δ-HCT降低时,严紧性因素增加,可以发生聚合酶链反应的高辨别引发。这些是多路复用PCR所需的条件。术语多路复用指在PCR反应中,使用一组以上的引物并产生多种产物的能力或者每组PCR引物使用一种以上靶核酸的能力。使用三氯乙酸四甲基铵是特别有用的,因为抵销了G+C含量对Tm(稳定性)的依赖性。

将所述的hybotropic溶液用于提高PCR中的引发特异性。就可提高引发步骤特异性的机制而言,有数种选择。第一种是使用(共价)连接有PCR引物之一的固相载体。所述固相载体可以采用许多形式如珠、膜等。引发步骤可以在hybotrope中进行,然后可洗涤固相载体并将所述固相载体移到支持聚合酶链反应的溶液中。然后

82

98809047.3说 明 书 第70/205页

将所述固相载体移回到用于引发反应的nesstrope中,重复循环过程。固相载体在两种不同溶液间的循环只能进行有限的次数(1-15循环),然后可以进行标准化PCR缓冲液中的传统扩增循环。或者,将所研究的靶核酸用电场(即电泳)在引发溶液和聚合酶延伸反应溶液间移动。

hybotrope和/或非碱基或非核苷寡核苷酸探针的使用可提高聚合酶等温应用于核酸序列扩增的特异性和效率。使用核酸聚合酶的等温条件的应用包括核酸测序、基因定型、突变检测、寡核苷酸连接检测、突变检测等。

用于提高杂交反应特异性的另一种方法用碱基类似物代替A、G、C或T核苷酸中的任意一种,产生碱基错配。研究表明,当精确地放置错配时,一些含碱基对错配的引物的特异性提高(参见,Wenham等,Clinical Chemistry 37:241,1991;Newton等,NucleicAcids Resaearch 17:2503,19;Ishikawa等,Human Immunology42:315,1995)。但是,在完全配对的杂交物与导入了一个碱基错配的相同杂交物之间,熔融温度只有0.5℃这样小的差异是很常见的(参见Tibanyenda等,European Journal of Biochemistry 139:19,1984;Werntges等,Nucleic Acids Research 14:3773,1986)。甚至一个与两个碱基错配的双螺旋之间的特异性比完全配对的双螺旋与有一个错配的相同双螺旋之间有更好的特异性(参见Guo等,Nature Biotechnology 15:331,1997)。Guo等发现:对于一个20聚体的双螺旋来说,在零个与一个错配之间有4℃的ΔTm,而在一个与两个相邻错配之间,有13℃的ΔTm。但是,甚至带有两个错配时,对双螺旋常常仍然几乎没有去稳定作用。这样始终不能辨别错配将导致在PCR中缺乏特异性。

对在每个使用至少一个核苷酸类似物的杂交中使用一个以上的碱基对错配进行了评估(参见Guo等,Nature Biotechnology 15:331,1997)。在这种情况下,类似物化合物由3-硝基吡咯代替嘌呤或嘧啶碱基。3-硝基吡咯能够与这四种碱基形成最小的氢键(参见

83

98809047.3说 明 书 第71/205页

Nichols等,Nature 369:492,1994;Bergstorm等,Journal of theAmerican Chemical Society 117:1201,1995)。通过导入人工错配,双螺旋熔融温度间产生约5℃-15℃的较大差异,当所述错配位于15聚体杂交寡核苷酸的中心时,差异最大。当将人工核苷酸导入已经含有一个碱基错配的双螺旋中从而产生两个错配的双螺旋时,ΔTm的差异最显著。去稳定化的程度取决于错配的类型(例如G/T)和两个错配间的间距。在试验中,碱基类似物核苷酸距位于15聚体中心的碱基错配3’侧1-7个碱基。3种不同碱基错配的15聚体的ΔTm从2℃稳定化(仅在C/T错配的情况下并当错配相邻时)至7℃进一步去稳定化,最大去稳定作用始终发生于3或4个碱基的错配间距时(参见Guo等,Nature Biotechnology 15:331,1997)。

当导入两个人工错配时,人工碱基的邻近对去稳定的程度有很大影响。两个人工错配集中在从6 bp 21体双螺旋的中间间隔距离从6bp开始。与完全匹配的双螺旋相比,去稳定或ΔTm最小为12℃。当两个人工错配有10个碱基对的距离时,会产生20℃以上的最大差异。这种差异与螺旋转角相对应,并说明两个人工碱基之间存在某种相互作用,从而降低了双螺旋的稳定性。

在试验中,当所用的PCR引物在引物与DNA样品间含有一个或两个人工错配时,进行PCR将得到与对完全配对引物预期一样的结果(参见Guo等,Nature Biotechnology 15:331,1997)。但是,当引物含有一个真的和一个人工错配时,PCR不能产生任何可检测的结果。而带有完全匹配的和真错配的PCR均可产生可检测量的PCR产物。当用杂交探针进行相同研究时得到类似结果:即带有完全配对、真错配和人工错配的探针可退火,而含人工错配又含真错配的探针并不退火。这些研究表明当在杂交反应中掺入人工碱基错配时会得到更高的特异性,以致当存在天然错配时,他们的热动力学稳定性低于完全匹配的杂交反应,因此,不太可能在检测或PCR中产生假阳性。但是,令人感兴趣的是,在试验中,仅含人工错配的双螺旋的上述热动力学稳定性方面的差异未得到证明。

84

98809047.3说 明 书 第72/205页

实现杂交分辨的另一种方法是通过含缺刻与缺口的杂交双螺旋在稳定性方面的差异。在这些反应中,双螺旋是从连续排列或者带有数个碱基对缺口而非连续排列地杂交于较长链上的串联堆积短寡聚体形成的。对产生缺刻的杂交进行堆积杂交,其中另一DNA链跨过缺刻杂交。在存在缺口的非连续寡聚体中,不发生堆积杂交。堆积有增加辨别能力的效果,如相比于非连续对应物降低了解离率并且热动力学稳定性更高所证明的(参见Lane等,核酸研究25:611,1997)。热动力学测量值表明杂交堆积的双螺旋标准与有缺口的双螺旋间的自由能改变(ΔG)差异是1.4-2.4kcal/mol。因此,通过多个短探针的使用,可以在杂交中进行辨别。

目前使用的大部分碱基模拟物是寻求通用碱基的结果。许多人使用硝基唑碱基类似物,并已表明在碱基配对中的辨别能力降低。已经研究了一系列的硝基唑核酸碱基(nucleobase)类似物以试图进一步深入研究在碱基配对中电子结构和杂环大小的重要性,以开发更有效的通用碱基(参见,Bergstrom等,核酸研究25:1935,1997)。在此项工作中,测量了3-硝基吡咯、4-硝基吡唑、4-硝基咪唑和5-硝基吲哚的脱氧核苷的热动力学特性。为了比较,还测量了次黄嘌呤和吡唑的脱氧核苷以及非碱基间隔基1,2-二脱氧核糖的热动力学测量值。合成每种修饰核苷的四种寡核苷酸以便得到其中四种天然碱基中的一种被放在碱基模拟物对面的双螺旋。已证实所分析的所有碱基模拟物均比天然配对物(A+T:Tm=65.7℃,C+G:Tm=70.5℃)不稳定得多,5-硝基吲哚的Tm是35-46℃,所分析的其他硝基唑碱基的是18-29℃。唯一的例外是与dGTP配对的4-硝基咪唑,Tm是40.9℃。在分析双螺旋熔融的自由能时发现,3-硝基吡咯碱基模拟物与四种天然碱基配对时辨别能力最小,其总ΔG为0.4kcal/mol。辨别力次差的是ΔG为0.8kcal/mol的5-硝基吲哚。这两个值比天然碱基配对物A+T和G+C之间的ΔGl.1kcal/mol小。4-硝基吡唑对与A配对有轻微的偏好,ΔG为1kcal/mol,比与C、G和T自由能更稳定。最后,由于咪唑N3与脱氧鸟苷N1能形成氢键,

85

98809047.3说 明 书 第73/205页

4-硝基咪唑对与G配对有更高的选择性(由其高Tm值可证明)。但是应注意到,上述值依赖于碱基与模拟物最接近。进一步的研究中使邻近程度改变,发现3-硝基吡咯和5-硝基吲哚是非辨别性碱基配对物。

尽管所用的碱基模拟物显示ΔS和ΔH之间关系与碱基结合方式无关,但发现焓和熵的改变彼此相关(即较大的焓改变与较大的熵改变有关)。所观察到的是在非氢键结合的碱基模拟物中有较小的焓和熵改变。熵改变值低反映了未通过氢键相互作用锁在双螺旋中的碱基有较大的运动自由度。焓改变值小反映了氢键相互作用的改变,所述改变是与碱基模拟物相反的碱基的氢键相互作用丧失的结果。如果天然碱基仍堆积在螺旋中,没有相反的氢键配对物,则它已失去了与水的氢键相互作用,而没有再得到一个新的供体/受体配对物。

相似的研究涉及检测带有氨甲酰基或硝基取代的杂环碱基的无环核苷类似物(参见,Aerschot等,核酸研究,23:4363,1995)。无环核苷的使用使构建体有足够的灵活性,可以产生良好的碱基堆集并使碱基模拟物得到与相应碱基进行最佳碱基配对的取向。所检测的杂环碱基包括4,5-咪唑二羧酰胺、4-硝基咪唑和5-硝基吲唑。这些复合物以无环次黄嘌呤、1-(2(-脱氧(-D-核糖呋喃基)-3-硝基吡咯、5-硝基吲哚和2-脱氧肌苷作为参考。所有新的无环复合物均比天然碱基的熔融温度低7-20℃。当与四种天然碱基中的一种配对时,5-硝基吲唑的变化最小,ΔTm仅为2.2℃,而4-硝基咪唑具有8.0℃的变化,dG与按上述观察的其它三种碱基的显著不同。参照化合物中,脱氧肌苷的ΔTm为5.6℃,5-硝基吲哚的ΔTm为1.0℃,1-(2(-脱氧(-D-核糖呋喃基)-3-硝基吡咯的ΔTm为5.1℃,无环次黄嘌呤的ΔTm为4.8℃。但是,当置于几乎不含腺苷的寡核苷酸中时,所有碱基模拟物都有几乎相同的去稳定作用(ΔTm4-5℃),而4-硝基咪唑和无环脱氧肌苷例外,ΔTm分别为7.0℃和8.9℃。

Aerschot及其同事还检测了将多种碱基模拟物掺入到寡核苷酸

86

98809047.3说 明 书 第74/205页

中的影响(参见,Aerschot等,核酸研究,23:4363,1995)。总之,熔融温度降低,但掺入三种碱基模拟物时,降低得最显著。但是,硝基吲哚的温度差最小。

另一种碱基模拟物,1-(2(-脱氧-(-D-核糖呋喃基)咪唑-4-羧酰胺(核苷1)更倾向于模拟dA以及dC核苷(参见Johnson等,核酸研究25:559,1997)。能够代替dA和dC是由于围绕羧酰胺/咪唑键以及咪唑与呋喃糖环之间的键可旋转的结果。当咪唑与呋喃糖处于反式并且羧酰胺基团与咪唑处于反式时,氧上的未共用电子对以及酰胺NH氢之一处于模拟腺苷NH2和N-1的位置。咪唑围绕糖苷键旋转至顺式取向使得酰胺基团处于与胞嘧啶的NH2和N-3的位置大体相配的位置。

当用核苷1代替任何天然核苷时,焓值增加,并且用dG代替1-C配对时增加值最大(从G/C配对的ΔH=74.7(kcal/mol)/ΔG=-16.5(kcal/mol)到ΔH=-45.5(kcal/mol)/ΔG=-5.8(kcal/mol))。dA取代时焓的变化最小(从A/T配对的ΔH=-72.9(kcal/mol)/ΔG=-15.4(kcal/mol)到1-T配对的ΔH=-66.7(kcal/mol)/ΔG=-11.7(kcal/mol))。相应的,Tm分别从A-T的65.7℃和C-G的70.5℃显著降低至1-T配对的46.6℃、1-G配对的43.4℃、1-A的27.6℃和1-C的14.6℃。

当用于PCR反应时,优选将核苷1和其N-丙基衍生物作为dATP类似物掺入(参见Sala等,核酸研究24:3302,1996)。但是,掺入到DNA模板后,其不明确的氢键电位会以3×10-2/碱基/扩增的频率引起任何天然碱基的错误掺入。大部分取代(主要由G组成)是部分模板中绕羧酰胺键旋转的结果。11-15%的取代是由于咪唑部分绕糖苷键旋转的结果。作为部分DNA模板,该N-丙基衍生物尽管存在其丙基部分,但与1的行为方式相同。该研究表明尽管1的行为更象dATP,但是在PCR型环境中,它能够与所有四种天然核苷酸一样地表现。由此及上述研究表明,通过改变碱基模拟物和其在寡核苷酸内的位置,可获得广泛的双螺旋稳定性。

87

98809047.3说 明 书 第75/205页

在本发明的一个方面,提供了确定核酸分子或片段(或用于检测选定的核苷酸分子或片段的存在)的方法,所述方法包括(a)从一种或多种选定的靶核酸分子产生标记的核酸分子,其中标记与特定的核酸分子有关并可用非荧光光谱测定法或电势测定法检测,(b)通过大小分离标记分子,(c)从所述标记分子裂解所述标记,和(d)通过非荧光光谱测定法或电势测定法检测标记,由此确定核酸分子的身份。

在本发明的相关方面,提供了检测所选的核酸分子的方法,所述方法包括(a)在足以使标记的核酸探针与选定的互补靶核酸序列杂交的条件和时间内,将标记的核酸探针与靶核酸分子混合,其中标记的核酸探针可用非荧光光谱测定法或电势测定法检测,(b)改变杂交的标记探针、未杂交的探针或靶分子或探针:靶杂交物的大小,(c)通过大小分离标记的探针,(d)从标记的探针裂解下标记,和(e)通过非荧光光谱测定法或电势测定法检测标记,由此检测所选的核酸分子。这些及其它相关技术将在下文详细讨论。 2.PCR

PCR可以在仅仅几小时内将任何来源(病毒、细菌、植物或人)的目的DNA序列扩增数亿倍。由于反应是高度特异、容易自动化并且能够扩增很少量的样品,因此,PCR特别有价值。由于这些原因,PCR已对临床药物、遗传疾病诊断、法医学和进化生物学产生了巨大的影响。

简而言之,PCR是一种以特定聚合酶为基础的过程,在含4种DNA碱基和靶序列两侧的2种DNA片段(引物,各约20个碱基长)的混合物中,可以合成与给定的DNA链互补的链。将所述混合物加热以分离含靶序列的双链DNA,然后冷却使(1)引物在分开的链上找到并结合至其互补序列上和(2)聚合酶延伸引物形成新的互补链。重复加热和冷却过程可以以指数级复制靶DNA,因为每个新双链都分开成为两个模板进行进一步的合成。在约1小时内,20个循环的PCR可

88

98809047.3说 明 书 第76/205页

以将靶DNA扩增数百万倍。

在本发明的一个实施方案中,提供了用PCR技术确定核酸分子身份或者检测例如生物样品中特定核酸分子的方法。简而言之,所述方法包括下列步骤:在PCR过程中产生一系列标记的核酸片段或分子,然后通过大小分离所得的片段。大小分离步骤可利用本文描述的任何技术完成,包括例如凝胶电泳(如聚丙烯酰胺凝胶电泳)或者优选HPLC。然后从分离的片段中裂解标记,并用相应的检测技术检测所述标记。所述技术的实例已在本文作了描述,包括例如质谱法、红外谱法、恒电势电流分析法或UV光谱法。 3.RNA指纹法和示差显示

当模板是RNA时,指纹法中的第一步是逆转录。Liang和Pardee(Science 257:967,1992)首先描述了RNA指纹法,该方法使用引物进行逆转录,该引物以oligo(dT)为基础,但在5’末端带有由两个碱基组成的“锚”(例如oligo5’-(dT11)CA-3’)。引发主要在poly(rA)尾的5’末端开始并主要在结束于5’-UpG-poly(rA)-3’的序列内进行,选择性大约为12个聚腺苷酸化RNA中为一个。逆转录和变性后,在所得的第一条cDNA链上完成任意引发。现在可用PCR得到与引物最匹配并衍生于mRNA和聚腺苷酸化异源RNA 3’末端的产物的指纹。已将该方法命名为“示差显示”。

或者,可在逆转录的第一步中使用任意引物,选择在RNA内有6-8个与引物3’末端匹配的碱基的那些区域。然后用相同或不同的任意引物,任意引发所得的cDNA第一链,然后进行PCR。这种特定的方法可以在RNA中的任何区域进行,包括开放阅读框架(Welsh等,Nuc.Acids.Res.20:4965,1992)。另外,该方法可应用于未聚腺苷酸化的RNA,例如许多细菌RNA。将通过任意引发PCR所进行的RNA指纹法称为RAP-PCR。

如果对来自已经进行过不同试验处理或有不同发育史的细胞、组织或其它生物材料的样品进行RNA的随机引发PCR指纹法,则可

98809047.3说 明 书 第77/205页

检测样品间基因表达的差异。对于每个反应,均假定发生相同数量的有效PCR复制,而且cDNA产物起始浓度的任何差异可体现为最终指纹中的强度比例。凝胶上单泳道内条带强度之间没有任何有意义的关系,它们只是匹配和丰度的函数。但是,泳道之间的比例是各RNA样品之差异的反映,使得可以检测有不同表达的RNA。甚至当循环数足以使PCR反应达到饱和时,仍能够保持样品起始材料之间的比例。这是因为到达饱和所需的复制数几乎完全由构成主要指纹的不变产物控制。就此而言,PCR指纹法不同于传统的单产物PCR,在传统PCR中,除非在扩增的指数期取样,否则就不能保持样品间起始材料的比例。

在本发明的一个实施方案中,提供了利用RNA指纹技术鉴定例如生物样品中的核酸分子或者检测生物样品中选定的核酸分子的方法。简而言之,所述方法主要包括产生一系列标记的核酸片段的步骤。通过PCR或类似扩增方案得到片段,然后将其通过大小分离。大小分离步骤可以是例如本文描述的任何技术,包括例如凝胶电泳(例如聚丙烯酰胺凝胶电泳)或优选HPLC。然后从分离的片段上裂解所述标记,再用相应的检测技术检测所述标记。适宜技术的相应实例包括质谱法、红外光谱法、恒电势电流分析法或UV光谱法。任何给定核酸片段的相对数量并不重要,但是当参考对照样品时,条带的大小就非常有价值。

4.基于荧光的PCR单链构型多态现象(PCR-SSCP)

除RFLP方法外,还有许多方法可用于分析碱基取代多态现象。Orita等依据变性DNA中的构型差异设计了一种分析这些多态现象的方法。简而言之,用酶消化或PCR产生相对较小的DNA片段,然后将所述片段变性,接着在非变性聚丙烯酰胺凝胶上电泳进行分辨。通过电泳迁移率变化,可检测因碱基取代而引起的单链DNA片段中的构型差异。链内碱基配对产生高度序列特异性且电泳迁移率不同的单链构型。但是在使用常规SSCP的研究中,检测率为35%至

90

98809047.3说 明 书 第78/205页

近100%,而且最高的检测率通常需要数种不同的条件。原则上,也可用所述方法分析因短插入或缺失所致的多态现象。该方法是鉴定DNA中点突变和缺失的最有效的方法之一(SSCP-PCR,Dean等,细胞61:863,1990)。

在本发明的一个实施方案中,提供了利用PCR-SSCP鉴定例如生物样品中的核酸分子或检测例如生物样品中选定的核酸分子的方法。简而言之,所述方法主要包括产生一系列标记的核酸片段的步骤。然后通过大小分离用PCR产生的片段。优选地,该大小分离步骤是非变性的,而且在分离前,将核酸片段变性。大小分离步骤可以利用例如凝胶电泳(例如聚丙烯酰胺凝胶电泳)或优选HPLC完成。然后从分离的片段上裂解所述标记,再用相应的检测技术(如质谱法、红外光谱法、恒电势电流分析法或UV光谱法)检测所述标记。 5.双脱氧指纹法(ddF)

已描述了另一种方法(ddF,Sarkar等,Genomics 13:441,1992),当用回顾性的和预期的方式检测时,该方法对人IX因子基因中单个碱基变化的检测率达到100%。总体上,当分析来自血友病B患者的基因组DNA时,检测到所有84种不同的序列变化。

简而言之,在进行基因定型或其它目的的标记应用中,一种可以使用的方法是双脱氧指纹法。该方法利用Sanger测序反应中的双脱氧终止子。该方法的原理如下:将待测序的靶核酸放在拥有双脱氧终止子的反应物中,所述终止子与靶核酸中已知被突变的碱基互补。例如,如果突变产生A->G的变化,则反应就应用C双脱氧终止子反应。用PCR引物确定所需靶序列的位置并扩增所需序列。如果假设的靶序列含有A->G的变化,则由于被扩增序列中双脱氧终止子的掺入,序列群的大小就会发生改变。在标记的这种特定应用中,突变情况下将产生具有可预测大小的片段。所述标记将与PCR引物的5’末端相连,并给样品型和双脱氧终止子型提供“图谱”。如果PCR扩增反应发生,则可通过例如HPLC或PAGE经大小分离所得的

91

98809047.3说 明 书 第79/205页

片段。在分离过程结束时,将DNA片段收集在暂时的参照框架中,裂解标记,根据由于存在因给定双脱氧终止子的掺入而产生的早熟链终止子引起的链长度改变,确定是否存在突变。

值得注意的是,ddf导致双脱氧终止片段的获得或失去,或者至少一种终止片段或产物的迁移率发生改变。因此,用该方法,可以研究一种片段在其它分子量片段高背景下的迁移率的改变。一个优点是可预知与给定突变有关之片段的长度。

在本发明的一个实施方案中,提供了利用ddF技术鉴定例如生物样品中的核酸分子或检测例如生物样品中选定的核酸分子的方法。简而言之,所述方法主要包括产生一系列标记的核酸片段,然后依据大小进行分离。优选,大小分离步骤是非变性的,而在分离前将核酸片段变性。大小分离步骤可以利用例如凝胶电泳(例如聚丙烯酰胺凝胶电泳)或优选HPLC完成。然后从分离的片段上裂解所述标记,再用相应的检测技术(质谱法、红外光谱法、恒电势电流分析法或UV光谱法)检测所述标记。 6.图谱和RFLP

性核酸内切酶识别短DNA序列并在那些特异性位点切割DNA分子。一些酶(稀有切割酶)切割DNA的频率很低,产生少量的大片段(数千至数百万bp)。大部分酶切割DNA的频率很高,因此,产生大量小片段(100bp以下,至1000bp以上)。平均来说,4碱基识别位点的酶将产生256个碱基长的片段,6碱基识别位点的酶将产生4000个碱基长的片段,而8碱基识别位点的酶将产生000碱基长的片段。由于已鉴定了数百种不同的酶,因此,可将DNA切割成许多不同的小片段。

为分析DNA多态现象已发展了许多技术。最常用的方法是片段长度多态(RFPL)方法,该方法将酶消化、凝胶电泳、印迹到膜上和与克隆的DNA探针杂交组合在一起。多态现象检测为印迹上标记片段之长度的变化。当序列改变在酶位点内时,可用RFLP

92

98809047.3说 明 书 第80/205页

方法分析碱基取代,或者通过选择在重复单位外进行切割的酶分析微卫星/VNTR。琼脂糖凝胶通常不能提供分辨差异仅在于单个重复单位不同的微卫星/VNTR等位基因所必需的分辨率,但是许多微卫星/VNTR可变性很高以致仍可得到含大量信息的标记。

在本发明的一个实施方案中,提供了利用作图或RFLP技术鉴定例如生物样品中的核酸分子或检测例如生物样品中选定的核酸分子的方法。简而言之,所述方法主要包括产生一系列标记核酸片段的步骤,其中将产生的片段用酶消化。通过将标记的探针与消化的靶核酸杂交产生标记的片段。所述杂交步骤可以在性核酸酶消化前或消化后进行。然后通过大小分离所得的消化片段。该大小分离步骤可以利用例如凝胶电泳(例如聚丙烯酰胺凝胶电泳)或优选HPLC完成。然后从分离的片段上裂解所述标记,再用相应的检测技术(如质谱法、红外光谱法、恒电势电流分析法或UV光谱法)检测所述标记。 7.DNA指纹法

DNA指纹法涉及展示来自具体DNA样品的一组DNA片段。目前有各种DNA指纹技术可供使用(Jefffreys等,Nature 314:67-73,1985;Zabeau and Vos,1992);“选择性片段扩增:DNA指纹法的一般方法”(Selective Restricton Fragment Amplifcation:AGeneral Method for DNA Fingerprinting),欧洲专利申请92402629.7;Vos等,“DNA指纹:DNA指纹新技术”(DNA

FINGERPRINTING:A New Technique for DNA Fingerprinting)核酸研究23:4407-4414,1996;Bates,S.R.E.,Knorr,D.A.,Weller,J.W.,and Ziegle,J..S.,“自动化分子标记获得和分析的仪器操作”(Instrumentation for Automated Molecular Marker

Acquisition and Analysis)Chapter 14,pp.239-255,《植物分子遗传学的影响》一书,B.W.S.Sobrall编,Birkhauser出版,1996。 因此,本发明的一个实施方案提供利用DNA指纹法鉴定例如生

93

98809047.3说 明 书 第81/205页

物样品中的核酸分子或检测例如生物样品中选定的核酸分子的方法。简而言之,所述方法主要包括产生一系列标记的核酸片段的步骤,然后通过大小分离片段。大小分离步骤可以利用例如凝胶电泳(例如聚丙烯酰胺凝胶电泳)或优选HPLC完成。然后从分离的片段上裂解所述标记,再用相应的检测技术(质谱法、红外光谱法、恒电势电流分析法或UV光谱法)检测所述标记。

简而言之,DNA指纹法依据的是从基因组DNA的总消化产物选择性PCR扩增片段。该技术包括三个步骤:1)DNA片段的消化和寡核苷酸衔接子的连接,2)选择性扩增片段组,3)扩增片段的凝胶分析。片段的PCR扩增是通过利用所述衔接子和位点序列作为引物退火的靶位点来完成的。选择性扩增是通过使用延伸至片段的引物来完成的,仅仅扩增其中引物延伸物与位点侧的核苷酸相匹配的那些片段。

因此,利用该方法可得到一系列片段组,所述片段可通过各种方法(即PAGE、HPLC或其它类型的光谱法)肉眼观察,而不用预先了解核苷酸序列。该方法还可以共扩增大量片段。但是片段的数量取决于检测系统的分辨率。通常可扩增50-100个片段并在变性聚丙烯酰胺凝胶上电泳检测。在本文所述的应用中,用HPLC完成分离。

DNA指纹技术依据的是利用PCR扩增基因组片段亚组。将DNA用酶切割,然后将双链衔接子与DNA片段的末端相连,得到用于扩增反应的模板DNA。连接的衔接子和相邻酶(位点)的序列引物DNA指纹法中引物的结合位点,所述引物用于PCR扩增。在PCR引物的3’末端包含有选择性的核苷酸,因此,引物仅可从一个小组的位点引发DNA合成。只有其中位于位点侧的核苷酸与选择性的核苷酸匹配的片段能被扩增。

DNA指纹法产生不同片段长度的“指纹”图,它们是个体生物特有的并可再现的。可将这些指纹用于区分甚至关系很近的生物体,包括近纯合系。片段长度的差异可以说明位点或者引物延伸位

94

98809047.3说 明 书 第82/205页

点的碱基改变,或者说明DNA片段内的插入或缺失。

通过利用与片段相连的序列已知的衔接子,可不再需要有关靶基因组的序列知识。PCR引物是已知序列的衔接子和位点特异性的。下面将描述遗传指纹法的步骤。

1)和连接。用两种不同的酶得到基因组DNA的片段:稀有切割酶(6碱基识别酶EcoRI)和常见切割酶(4碱基识别酶MseI)。产生三种不同的片段:一种是EcoRI在两个末端进行了切割,一种是MseI在两个末端进行了切割,一种是EcoRI在一个末端进行了切割,MseI在另一末端进行了切割。然后将双链衔接子与DNA片段的粘性末端相连,得到用于扩增的模板DNA。衔接子是EcoRI位点或MseI位点特异性的。和连接可在同一反应中进行。衔接子与消化的DNA的连接改变了位点,从而可以使连接后不发生第二次性消化。

2)预选择性扩增。衔接子与位点的序列作为引物结合位点用于“预选择性PCR扩增”。每个预选择性引物都含有“选择性”核苷酸,可以识别含有与位点下游匹配的核苷酸的片段亚组。预选择性PCR的主要产物是含有一个MseI切割位口和一个EcoRI切割位口并且还含有匹配的内部核苷酸的那些片段。预选择性扩增使片段混合物的复杂性降低了16倍。

3)用CMST标记的引物选择性扩增。然后通过用经CMST标记的选择性引物完成第二次PCR,进一步降低PCR产物混合物的复杂性(256倍),并使片段标记上一组CMST。为了此扩增,可以从种(8种MseI和8种EcoRI引物的所有可能的组合)不同的引物对中选择。这些引物中的每一个都有三个选择性的核苷酸。第一个与预选择扩增中所用的相同;其它两个可以是四种核苷酸的16种可能组合中的任何一种。在扩增的此阶段,仅仅会扩增含有与所有三个位置的核苷酸均匹配的片段亚组。

8.应用可裂解标记进行基因定型和多态现象检测

95

98809047.3说 明 书 第83/205页

a.引言

尽管少数已知的人DNA多态现象是因非重复序列的插入、缺失或者其它重排产生的,但是大部分则或者是因单个碱基取代或者是因串联重复序列数的变化产生的。碱基取代在人基因组中非常丰富,平均每200-500bp就会发生一次。串联重复序列区组的长度变化在基因组中也很常见,至少占散布多态位点(称为座位)的千分之几十。串联重复序列多态现象的重复长度从(dA)n(dT)n序列中的1bp至α卫星DNA中的至少170bp不等。可将串联重复多态现象分成由小卫星/串联重复数变化(VNTR)和微卫星组成的两大类,前者的重复长度通常为数十个碱基对和数十至数千个总重复单位,后者的重复长度最多6bp,最大总长度约70bp。迄今为止,已鉴定的大部分微卫星多态现象都是基于(dC-dA)n或(dG-dT)n双核苷酸重复序列。微卫星多态现象的分析包括通过聚合酶链反应(PCR)扩增含重复序列组的小片段DNA,然后在变性的聚丙烯酰胺凝胶上电泳扩增的DNA。PCR引物与重复序列组两侧的特有序列互补。通常用聚丙烯酰胺凝胶而不是琼脂糖凝胶分析微卫星,因为等位基因通常仅有一个重复序列大小的差异。

因此,本发明的一个方面提供了用于选定生物体的基因定型的方法,该方法包括:(a)从选定的靶分子产生标记的核酸分子,其中所述标记与特定的片段相关并可用非荧光光谱测定法或电势测定法检测,(b)用连续长度分离标记的分子,(c)从标记的分子裂解所述标记,和(d)通过非荧光光谱测定法或电势测定法检测标记,然后由此确定所述生物体的基因型。

另一方面,提供了用于选定生物体的基因定型的方法,该方法包括(a)在足以使标记的分子与靶分子杂交的条件下和时间内,将标记的核酸分子与选定的靶分子混合,其中所述标记与特定的片段相关并可用非荧光光谱测定法或电势测定法检测,(b)用连续长度分离标记的分子,(c)从标记的分子裂解所述标记,和(d)通过非荧光光谱测定法或电势测定法检测标记,然后由此确定所述生物体的基因

96

98809047.3说 明 书 第84/205页

型。

b.将可裂解标记用于基因定型

用于鉴定片段长度多态现象(RFLP)的PCR方法与同特异性PCR引物有关的标记的电泳和检测联用。总之,一个PCR引物拥有一个特异性标记。因此,一个标记将代表一组PCR引物,因此将代表一预定的DNA片段长度。由凝胶中或从凝胶中洗脱的标记片段长度的变化检测多态现象。聚丙烯酰胺凝胶电泳通常可提供分辨因单个重复单位不同而引起的小卫星/VNTR等位基因差异所必需的分辨率。分析微卫星多态现象包括通过聚合酶链反应(PCR)扩增含重复序列组的小片段DNA,然后在变性聚丙烯酰胺凝胶上电泳扩增的DNA或者通过HPLC分离DNA片段。扩增的DNA将因引物5’末端含有可裂解标记的引物而被标记。引物通过链延伸掺入到新合成的链中。PCR引物与位于重复序列组侧翼的特有序列互补。也可扩增小卫星/VNTR多态现象,与上述有关微卫星的相同。

对多种类型DNA序列多态现象的描述已为理解人基因组结构提供了重要基础(Botstein等,Am.J.Human Genetics 32:p314,1980;Donis-Keller,Cell 51:319,1987;Weissenbach等,Nature 359:794)。利用这些DNA多态现象已促进了广泛编码结构连锁图谱的构建,所述图谱的构建为通过连锁确定疾病基因的位置提供了实践方法。在鉴定已表明含突变并在某些情况下导致疾病的人基因方面,微卫星双核苷酸标记被证明是非常有效的工具。基因组双核苷酸重复序列是高度多态性的(Weber,1990,基因组分析(Genomic

analysis),Vol 1,pp.159-181,Cold Spring Laboratory Press,Cold Spring Harbor,NY;Weber and Wong,1993,人类分子遗传学(Hum.Mol.Genetics),2,p1123)并可能有多达24个等位基因。用与双核苷酸重复序列周围独有区域互补的引物,通过PCR可扩增微卫星双核苷酸重复序列。扩增后,在大小分离步骤前,将数个扩增的座位混合(多路复用化)。对扩增的微卫星片段进行大小分离步骤,然后鉴定大小并因此鉴定等位基因的方法被称为基因定

97

98809047.3说 明 书 第85/205页

型。已经报道了利用可以进行高水平多路复用化的染色体特异性标记进行连锁分析的整个基因组扫描(Davies等,1994,Nature,371,p130)。

在用微卫星的基因定型中,可最大程度地利用标记。简而言之,构建携带标记的PCR引物并用于仔细选择的PCR中以扩增二-、三-或四核苷酸重复序列。然后通过例如HPLC或PAGE,按照大小分离扩增产物。然后随时间收集DNA片段,从其相应的DNA片段中裂解标记,然后通过与在大小分离步骤中的内部标准比较来推测长度。等位基因鉴定参照扩增产物的大小进行。

用于基因定型的可裂解标记法,可以在一个分离步骤中混合多个样品。主要有两种方法。高处理量筛选的第一种方法是检测一大个体组中的单多态现象。在该方案中,使用单个或嵌套PCR引物,而且每个扩增用一种DNA样品类型完成。在分离步骤中可以混合的样品数与每种检测技术可产生的可裂解标记数(即对于质谱仪标记是400-600)成比例。因此,可以在大个体组同时鉴定1至数种多态现象。第二种方法是使用多组PCR引物,所述引物可鉴定一种DNA样品中的多种多态现象(例如对一个个体进行基因定型)。在该方法中,在一个扩增反应中混合产生不同长度PCR产物的PCR引物。每个引物对或嵌套组由一种特异性可裂解标记编码,显示每个PCR片段由一个特异标记编码。在一个分离步骤中分离反应物(见下文)。在分离步骤中可以混合的样品数与每种检测技术可产生的可裂解标记数成比例(即对于质谱标记是400-600)。

还可将基因定型用于农业样品。例如扩增片段长度多态现象(AFLP)分析可用于对种质进行农艺学上有意义的分类。QTL作用的综述可揭示基因组中始终是多数量性状的重要决定因素的区域。AFLP和QTL多态现象结合在计划杂交中有预测性的作用。此外,有关基因组关键区域的相关或不相关种质的基因组结构的知识应有助于系统性了解相关种质中选择反应的基础。它还应有助于外来种质的系统性渐渗。最后,在分子水平对种质的综合性描述,结合深入

98

98809047.3说 明 书 第86/205页

的QTL信息,应有助于育种者同时保持平均性能并达到遗传多态现象。

在有常规鉴定工具并可利用遗传资源后,对于遗传资源的保护将有更大的动力。

Lander和Botstein(Lander,E.S.,and D.Botstein.“MappingMendelian factors underlying quantitative traits using RFLPlinkagee maps”Genetics 121:185-1,1987)回顾了导致孟德尔颗粒遗传理论协调之想法的发展和许多特征表现出连续变异的观察结果。分子标记技术的发展有助于发展足够密集的图谱以促进数量特征的研究。QTL检测发展的主要动力是希望控制应用育种领域中的基本决定因素。Paterson等“DNA markers in plant improvement”Adv.in Agron.46:39-90,1991;和Dudley,J.W.“Comparison ofgenetic distance estimators using molecular marker data”,Proc.Second Plant Breeding Symposium of the Crop Sci.Soc.Amer.and Amer.Soc.Hort.,Corvallis,OR,Amer.Soc.Hort.Sci.Alexandria,VA,1994,每篇文章均对这些技术在育种中的潜在应用作了极好的概述。例如数量性状表达与图谱标记的关系可作为决定有关育种操作、分子标记辅助选择(MMAS)或者发现外来种质中的理想基因的基础(另参见Tanksley等,“Advanced backcrossQTL analysis:a method for the simultaneous discovery andtransfer of valuable QTLs from unadapted germplasm into elitebreeding lines”Theor.Appl.Genet.92:191-203,1996)。已在许多大麦种质中将各种性状例如产率、交配质量、耐寒性和抗病性的QTL进行了定位(参见Hayes等,“Barley genome mapping andits applications”,P.P.Jauhar(编)《植物基因组分析方法》,CRC Press,Boca Raton,USA,1996;Hayes,P.M.et al.“Multipledisease resistance loci and their relationship to agronomicand quality loci in a spring barley population”JQTL,1996见http://probe.nalusda.gov.:8000/otherdocs/jqtl/index.

99

98809047.3说 明 书 第87/205页

htm)。这些报道,与有关其它作物的报道一样主要是描述性的。 这些QTL的遗传基础,尽管有很大的理论价值和显著的实践意义,但总体来说仍尚不清楚。据认为,在其它等位基因的作用可以由简单孟德尔理论解释的座位上,QTL是等位基因的结果。如果情况确实如此,则QTL等位基因应以加成方式起作用,而且它们可以从一组种质转移至另一组中。或者复杂的表型可能是复杂途径的最终结果(参见例如Dawkins,R.“The extended phenotype”OxfordUniversity Press,Oxford,UK,1982)。如果真是这样,QLT就代表了扰乱达到数量表型顶点的复杂途径之等位基因的作用。在该方案中,就很容易改变数量表型(即在所述途径中的任何点上存在不理想的等位基因,就足以改变该途径),但很难得到定量表型(即需要在多座位有理想等位基因的宿主来得到定量表型)。如果情况如此,则QTL等位基因渗入到不相关的种质中就是一个偶然情况:与参考图谱群无关的种质很可能在参考图谱群中有有利等位基因的座位上有不理想的等位基因。

控制的复杂程度可能随研究中的特征而变化。最终,甚至最复杂的表型也应可以还原成一系列不连续(但有可能是高度相互作用)的步骤。对于复杂的表型如产率、交配质量的能力和对生物或非生物压力的数量抗性,检测到相对少量的QTL(Hayes等,“Barleygenome mapping and its applications”,P.P.Jauhar(编)《植物基因组分析》,CRC Press,Boca Raton,USA,1996)。在一些情况下,可将候选基因作为QTL决定基提出:作为产率决定基的破碎(shattering)抗性(Hayes等,1993,同上文),作为麦芽提取物决定基的水解酶(可作为发酵底物的水溶性碳水化合物的量)(参见Hayes,P.M.1996,同上文)。大麦基因组图谱:对世界最古老作物的交配质量的新理解(参见例如MBAA 33:223-225)。

在其它情况下,尚没有候选基因可以作为复杂表型的决定基。一个例子是对条锈病的数量成年植物抗性,其中抗性QTL与报道的有孟德尔遗传模式之抗性基因的图谱位置不一致(参见Hayes,

100

98809047.3说 明 书 第88/205页

P.M.et al.“Multiple disease resistance loci and theirrelationship to agronomic and quality loci in a spring barleypopulation”JQTL,1996见http://probe.nalusda.gov.:8000/otherdocs/qtl/index.htm)。

也可将DNA水平的多态现象用于研究遗传多态现象。用从谱系分析(参见例如Eslick,R.F.等,“Genetic engineering as a keyto water use efficiency”Agric.Meteor.14:13-23,1974)到形态学性状(参见例如Tolbert,D.M.等“A diversity analysis ofa world collection of barley”Crop.Sci.19:7-794,1979),再到各类分子标记(Melchinger,A.E.等“Relationships amongEuropean barley germplasm:I.Genetic diversity among winterand spring cultivars revealed by RFLPs”Crop Sci.34:1191-1199,1994;Saghai-Maroof,M.A.等“RFLPs in

cultivated barley and their application in the evaluation ofmalting quality cultivars”Hereditas 121:21-29,1994)的各种工具,已在许多大麦种质系列中对遗传多态现象进行了测量。从提供丰富、中性适当的参考点的角度看,分子标记是特别有吸引力的。在分子多态现象的情况下,得到数据所需的时间和资源都是因素。

连锁图谱的构建是系统QTL分析中的第一步。象在作图中所用的本文公开的CMST技术平台这样的工具应该也可以使育种者在不降低现有种质池价值的情况下增加遗传多态现象。迄今为止,还没有足够的信息可以将多态性与QTL分析结果结合起来。这种结合策略的关键是快速、经济并能给整个基因组提供丰富多态现象的标记技术。本发明就提供了这一关键因素。 c.突变的酶检测和标记的应用

在所述特定的应用或方法中,通过酶促裂解给定核酸双螺旋中的错配碱基对来检测异源双螺旋中的错配。将需检测是否存在突变

101

98809047.3说 明 书 第/205页

的DNA序列用特异的一组引物通过PCR扩增,将扩增产物变性并与变性的参考片段混合、杂交,形成异源双螺旋。然后,将所述异源双螺旋用能识别并裂解存在错配的双螺旋的酶处理。所述酶是核酸酶S1、绿豆核酸酶、“解离酶”、T4核酸内切酶IV等。本质上,可以使用能体外识别错配并裂解所述错配的任何酶。用适宜的酶处理后,经例如HPLC或PAGE通过大小分离DNA双螺旋。随时间收集DNA片段。将标记裂解并检测。通过相对于野生型参考片段的片段迁移率的改变来检测是否存在突变。

d.将标记应用于寡核苷酸连接试验(OLA)

最初由Landegren等(Landegren等,科学241:487,1988)描述的寡核苷酸连接试验对于鉴定很大和极复杂基因组中的序列(已知)是一项有用的技术。OLA反应的原理是基于连接酶共价连接相邻地杂交于给定DNA靶上的两个诊断寡核苷酸的能力。如果在探针连接部位的序列,碱基对不完全匹配,连接酶将不能连接所述探针。热稳定性连接酶区别位于“上游”探针3’末端的潜在单碱基对差异的能力为分辨单个碱基对提供了机会(Barony,PNAS USA 88:1,1991)。在标记的应用中,可将所述标记与连接于扩增产物上的探针相连。完成OLR后,依据大小分离片段,然后裂解标记并用质谱法检测。

e.序列特异性扩增

可将3’末端与突变或正常寡核苷酸序列互补的PCR引物用于选择性扩增一种或另一等位基因(Newton等,核酸研究,17,

p2503;19,Genomics,5,p535;Okayama等,19,J.Lab.Clin.Med.,114,p105;SOmmer等,19,Mayo Clin.Proc.,,1361;Wu等,PNAS USA,86,p2757)。通常,在扩增后通过PAGE用肉眼观察PCR产物,但可将序列特异性扩增的原理应用于固相方式。

102

98809047.3说 明 书 第90/205页

f.将标记应用于一些以扩增为基础的检测

病毒的基因定型:标记的一种应用是通过与标记的探针杂交来鉴定病毒的基因型。例如F+RNA大肠杆菌噬菌体是可作为肠病毒污染指标的有用候选物。除血清定型外,利用核酸杂交法的基因定型也是一种可靠、快速、简单省钱的方法(Kafatos等,核酸研究7:1541,1979)。已将扩增技术和核酸杂交技术成功地用于对包括大肠杆菌在内的各种微生物进行分类(Feng,Mol.Cell Probes 7:151,1993)。可用本发明检测的代表性的病毒包括轮状病毒(Sethabutr等,J.Med.Virol.37:192,1992)、肝炎病毒如丙型肝炎病毒(Stuyver等,普通病毒学杂志(J.Gen.Virol.)74:1093,1993)、单纯性疱疹病毒(Matsumoto等,病毒学方法杂志(J.Virol.Methods)  40:119,1992)。

突变分析在癌症中的预后应用:已描述了各种实验用哺乳动物和人肿瘤中的遗传改变,而且所述遗传改变代表在致癌作用中观察到的形态改变顺序的形态学基础(Vogelstein等,NEJM 319:525,1988)。近几年,随着分子生物学技术的发展,对特定染色体上的等位基因丢失或者肿瘤抑制基因的突变以及数种癌基因(例如c-myc,c-jun和ras家族)中的突变进行了很多研究。以前的工作(Finkelstein等,Arch.Surg.128:526,1993)已鉴定了K-ras癌基因中的特定类型点突变与结肠癌诊断阶段之间的关系。结果表明突变分析可以提供肿瘤攻击性,包括转移方式和扩散的重要信息。TP53和K-ras-2突变分析在结肠癌III阶段中的预后价值最近得到进一步证实(Pricolo等,Am.J.Surg.171:41,1996)。因此,显然肿瘤和前癌细胞的基因定型和特异突变检测将在人类的癌症治疗中变得越来越重要。 9.单核苷酸延伸检测

在19年首先由Sokolov描述了有关基因组DNA中单核苷酸检测的引物延伸技术(核酸研究18(12):3671,19)。在该论文中,

103

98809047.3说 明 书 第91/205页

Sokolov描述了与囊性纤维化基因已知序列互补的30聚体和20聚体的单核苷酸延伸。表明该方法有能力正确鉴定在所述基因内的单核苷酸改变。在单核苷酸检测中,该方法是以利用用于标记方法的标记脱氧核苷酸为基础。

后来的文献描述了将单核苷酸延伸检测用于分析遗传疾病例如B型血友病(IX因子)和囊性纤维化基因(参见例如Kuppuswamy等,PNAS USA 88:1143-1147,1991)。Kuppuswamy等表明可将单核苷酸延伸检测用于检测遗传病,并已将其用于检测B型血友病(IX因子)和囊性纤维化基因。该方法也是基于与相邻于一已知单核苷酸多态现象的序列杂交的单核苷酸引物。然后,使引发的基因组DNA处于下述条件,即如果在所研究位点对面的位点与反应混合物中α标记的dNTP互补,则Taq聚合酶将加入P32标记的dNTP。

最近,就数量范围来说,单核苷酸延伸检测的参数、变异和多路复用分析已经得到详细的描述。因此,在1996年,Greenwood和Burke(Greenwood,A.D.和Burke,D.T.(1996)基因组研究(GenomeResearch),6,p336-348)详细描述了以数量范围来说的单核苷酸延伸检测的参数、变异和多路复用分析。RNA充当的是所研究序列PCR扩增的模板,所述序列在两个等位基因之间含有单碱基差异。通过将位于多态位点5’1个碱基的引物退火并通过1种标记碱基(或使用1种标记碱基)延伸,可以分析各PCR产生的模板是否存在各等位基因或者分析等位基因的相对量。只有当反应中有正确的碱基时,才可能在所述引物的3’末端发生掺入。然后分析延伸产物(通常通过PAGE)。因此,该策略是基于DNA聚合酶仅仅会将正确配对的核苷酸加至模板杂交引物的3’端的保真能力。由于每个反应仅加入一种双脱氧终止子核苷酸,因此,区分在所有四种dNTP中,哪种引物被延伸就是一件简单的事情。

因此,在本发明一个方面,提供了检测核酸分子内选定的一种核酸的方法,所述方法包括下列步骤:(a)在足以使引物与靶核酸分子杂交的条件下和时间内,在至少两个分开的反应中将标记的引物

104

98809047.3说 明 书 第92/205页

与靶核酸分子杂交,其中每个反应都含有酶,其中还将加入与腺苷、胞苷、鸟苷、胸苷或尿嘧啶互补的核苷酸链终止子,而且其中每个反应各含有不同的核苷酸链终止子,(b)通过大小分离标记的引物,(c)从标记的引物中裂解标记,和(d)通过非荧光光谱测定法或电势测定法检测所述标记,由此确定核酸分子内是否存在选定的核苷酸。

如本文所述,可以使用各种分离方法,包括例如液相色谱法如HPLC。另外,也可以使用各种检测方法,包括例如质谱法、红外光谱法、紫外线光谱法或恒电势电流分析法。此外,可以使用数种不同的酶(例如聚合酶)以及本文提供的任何标记。在某些优选实施方案中,反应中使用的每个引物有不同的特有标记。用该方法,可以同时检测多个样品(或多个位点)中是否存在选定的核苷酸。 可将例如本文描述的单核苷酸检测用于检测多态变体,或用于检测在已知序列内或附近是否存在特定的核苷酸。靶核酸分子不仅包括DNA(例如基因组DNA),也包括RNA。

总之,该方法包括将引物与靶DNA序列杂交,以便引物的3’末端紧邻待测和鉴定的突变。该方法与Sanger测序反应类似,但不同的是仅将给定核苷酸的双脱氧核苷酸加至反应混合物中。将每种双脱氧核苷酸用一特有的标记标记。在四种反应混合物中,仅有一种会将双脱氧终止子加至引物序列上。如果存在突变,通过双脱氧核苷酸上的特有标记可以进行检测并鉴定。通过用特有的标记来标记DNA引物,可以同时确定多个突变。在本发明的一个方面,提供了分析选定的生物样品中的单核苷酸突变的方法,所述方法包括下列步骤:得到来自生物样品的核酸,然后在足以使探针与所述核酸杂交的条件下和时间内,将暴露的核酸与一种或多种选定的核酸探针混合,所述探针带或不带标记均可,其中所述标记(如果使用的话)与特定核酸探针有关并可通过非荧光光谱测定法或电势测定法检测。在各含有一种不同的标记双脱氧终止子的四种反应中使DNA片段反应,其中所述标记与特定的双脱氧核苷酸有关并可用非荧光

105

98809047.3说 明 书 第93/205页

光谱测定法或电势测定法检测。按照大小,通过例如凝胶电泳(如聚丙烯酰胺凝胶电泳)或优选HPLC分离DNA片段。从分离的片段上裂解所述标记,然后通过相应的检测技术(例如质谱法、红外光谱法、恒电势电流滴定法或UV/可见光光谱法)检测所述标记。被检测的标记可能与研究中的特定DNA片段和突变核苷酸的身份有关。 10.扩增片段长度多态现象(AFLP)

AFLP作为一种用于DNA指纹分析的高度灵敏的方法被用于许多领域,包括植物和动物育种,医学诊断、司法分析和微生物分类,仅列举几个。(Vos等,核酸研究23:4407-4414,1995)AFLP的能力是基于在亲缘关系很近的种、变种或栽培品种之间存在分子遗传变异。通过遗传指纹技术研究DNA序列中的这些变异,通常可以得到特定基因型的“指纹”。这些“指纹”是通过DNA片段的选择性PCR扩增,即可简单用肉眼观察的RFLP。简而言之,遗传指纹技术由下列步骤组成:用两种不同的酶完全消化基因组DNA。将特定的双链寡核苷酸衔接子(~25-30bp)与消化的DNA片段相连。将与衔接子同源,但在3’末端有延伸序列的寡核苷酸引物用于扩增DNA片段亚组。(若延伸仅为1bp长,则还可进行预扩增步骤。然后用一有3个碱基对延伸序列的引物进行扩增。)这些延伸的长度可以从1至3个碱基不等,但是对于给定引物,长度是确定的。延伸序列的序列也可以随引物的不同而不同,但是在给定的引物内,应是唯一的、确定的序列。AFLP-PCR的选择性质是基于在寡核苷酸引物上的3’延伸序列。由于这些延伸序列与衔接子序列不同源,所以只有与延伸序列互补的DNA片段才会被扩增,因为与某些其它DNA聚合酶不同的是,如果错配发生在待合成分子的3’末端,则Taq DNA聚合酶不能延伸DNA。因此,在任何反应中,仅会扩增整个基因组的一个亚组。例如,如果使用2个碱基对的延伸序列,在256个分子中,仅有一个会被扩增。为了进一步实际观察的片段数量(以便观察合理数目的片段),仅标记引物中的一种。最后,在聚丙烯酰胺

106

98809047.3说 明 书 第94/205页

凝胶(测序型)上分离扩增的DNA,然后得到放射自显影图或磷图象。 在本发明的一个实施方案中,提供了利用遗传指纹技术鉴定例如生物样品中的核酸分子,或者检测例如所述样品中选定核酸分子的方法。简而言之,所述方法通常包括用两种不同酶完全消化(例如基因组DNA)的步骤。将特定双链寡核苷酸衔接子(~25-30bp)与经消化的DNA片段相连。任选地,可以用含1bp延伸序列的引物进行预扩增。然后将PCR产物稀释,将与衔接子同源、但在3’末端有延伸序列的标记引物用于通过PCR扩增DNA片段亚组。然后将所得的PCR产物按大小分离。所述大小分离步骤可通过各种方法完成,包括例如HPLC。然后,从分离的片段中裂解标记,并用相应的检测技术(例如质谱法、红外光谱法、紫外可见光光谱线或恒电势电流分析法)检测。 11.基因表达分析

本文公开的本发明之一是一种可在一次测量中测量大量基因(1-2000)表达的高处理量方法。该方法每次过程可同时测量一百份以上的样品。该方法可用于药物筛选、发育生物学、分子药物研究等。在本发明的一个方面,提供了分析给定生物样品中的基因表达方式的方法,所述方法包括下列步骤:(a)得到来自生物样品的核酸,(b)在足以使探针与核酸杂交的条件下和时间内,将得到的核酸与一种或多种选定的标记核酸探针混合,其中所述标记与特定的核酸探针有关并可用非荧光光谱测定法或电势测定法检测,(c)将未杂交的探针与杂交的探针分离,(d)从标记的片段中裂解所述标记,和(e)通过非荧光光谱测定法或电势测定法检测所述标记,由此确定生物样品中的基因表达方式。

在本发明一个特别优选的实施方案中,提供下列检测或方法:将来自靶源的RNA通过特异性杂交步骤(即通过结合的oligo(dT)捕获探针来捕获poly(A)mRNA)结合到固相载体上。然后洗涤固相载体并用标准方法(即反转录酶)在所述固相载体上合成cDNA。然后经水

107

98809047.3说 明 书 第95/205页

解除去RNA链。结果得到了共价固定在固相载体上的DNA群,所述DNA群反映了合成cDNA所源自的RNA的多样性、丰度和复杂性。然后,用与所研究基因序列互补的1至数千个探针探测(杂交)。每种探针均用一可裂解的质谱标记或其它类型的可裂解标记标记。探测步骤后,洗掉过量的或未杂交的探针,将所述固相载体置于例如微滴定板的孔中,然后从固相载体上裂解所述质谱标记。从样品容器孔中除去固相载体,用质谱仪测量孔的内含物。特定质谱标记的存在表明在样品中存在RNA,并证明在所述给定的生物样品中表达了特定的基因。该方法也是可定量的。

下文将详细描述利用可裂解标记进行基因表达快速测量的组合物和方法。简而言之,确定基因表达有用的组织(肝、肌肉等)、原代或转化的细胞系、分离或纯化的细胞或任何其它生物材料均可用作RNA源。在该优选方法中,在存在离液剂的条件下,将生物材料溶解以便抑制核酸酶和蛋白酶并支持靶核酸与固相载体的严谨杂交。可将组织、细胞和生物材料有效地溶解在1-6摩尔离液盐(盐酸胍、硫氰酸胍、高氯酸钠等)中。将生物样品溶解后,将溶液与固相载体混合以便捕获溶解产物中的靶核酸。用该方法的一种变换形式中,用固定的oligo(dT)捕获探针来捕获RNA。固相载体可包括尼龙珠、聚苯乙烯微珠、玻璃珠和玻璃表面或可以共价连接寡核苷酸的任何其它类型的固相载体。最好将所述固相载体用胺聚合物如聚环乙亚胺、丙烯酰胺、树状胺(amine-dendrimer)等涂覆。用聚合物上的胺共价固定寡核苷酸。优选用5’-胺合成寡核苷酸(通常是含有一6碳间隔臂和一远端胺的己胺)。寡核苷酸可以是15至50个核苷酸长。将寡核苷酸用同双功能或异双功能交联剂如氰尿酰氯活化。通过排阻层析从过量的交联剂(氰尿酰氯)中纯化活化的寡核苷酸。然后,将活化的寡核苷酸与固相载体混合以便达到共价连接。寡核苷酸共价连接后,将固相载体上未反应的胺加帽(即用琥珀酸酐)以消除固相载体上的正电荷。可以平行使用多个固相载体,并优选采用96孔或384孔方式。可将固相载体以96孔或384孔构型附着在钉、

108

98809047.3说 明 书 第96/205页

干或棒上,所述固相载体或者与所述特定结构是可分离的,或者与所述结构是一个整体。固相载体的特定构型对于检测方法的功能并不重要,但是会影响检测方法自动化的能力。将所述固相载体与溶解产物混合15分钟至数小时以便将靶核酸捕获到固相载体上。总之,靶核酸的“捕获”是通过靶RNA与所述固相载体上固定的捕获探针的互补碱基配对完成的。一种变换形式是利用大部分真核信使RNA上发现的3’poly(A)延伸部分与固相载体上固定的oligo(dT)杂交。另一种变换形式是利用特定寡核苷酸或长探针(50个碱基以上)捕获含特定序列的RNA。另一种可能是使用可能捕获靶RNA群中大量相关序列的简并引物(寡核苷酸)。RNA群的序列复杂性和所用捕获探针的类型将决定杂交时间。杂交温度由所用的离液剂类型和离液剂的最终浓度决定(一般性指南参见Van Ness和Chen,核酸研究,1991)。优选持续搅拌溶解产物与固相载体以达到靶RNA的扩散。捕获靶核酸的步骤完成后,从固相载体上洗涤溶解产物,然后除去所有离液剂或杂交溶液。优选将固相载体用离子或非离子洗涤剂、缓冲液和盐的溶液洗涤。接下来的步骤是合成与捕获的RNA互补的DNA。在该步骤中,用固定的捕获寡核苷酸作为反转录酶的延伸引物。所述反应通常在25-37℃完成,并优选在聚合反应过程中搅拌反应。cDNA合成后,由于是捕获寡核苷酸作为延伸引物,因此cDNA与固相载体共价相连。然后从cDNA/RNA双螺旋中水解RNA。该步骤可通过使双螺旋变性的热或利用化学水解RNA的碱(即0.1 N NaOH)而受到完成。该步骤的关键结果是使cDNA可用于随后与确定探针的杂交。然后洗涤固相载体或固相载体组以除去RNA或RNA片段。此时,固相载体含有cDNA分子的近似代表性群,所述群就序列丰度、复杂性和多样性而言,代表了RNA群。接下来的步骤是将选定的探针与固相载体杂交以鉴定是否存在特定cDNA序列或所述序列的相对丰度。优选探针是15至50个核苷酸长的寡核酸。探针的序列由检测方法的最终使用者(end-user)决定。例如,如果最终使用者打算研究组织中炎症反应的基因表达,则选择的探针应与大量细胞因子

109

98809047.3说 明 书 第97/205页

mRNA、编码调节脂类之酶的RNA、编码调节炎症反应相关细胞的因子等等的RNA互补。在确定了一组确定的序列用于研究后,将每个序列制成寡核苷酸探针,并给每个探针设计一特定的可裂解标记。然后将标记与相应的寡核苷酸连接。将所述寡核苷酸在适宜的杂交条件下与固相载体上的cDNA杂交。杂交步骤完成后,洗涤固相载体以除去任何未杂交的探针。再将固相载体或支持物阵列加热以裂解cDNA与固相载体之间的共价键。然后将标记的cDNA片段按照大小通过凝胶电泳(例如聚丙烯酰胺凝胶电泳)或优选HPLC分离。然后将标记从DNA探针分子中裂解并用相应的检测技术(例如质谱法、红外光谱法、恒电势电流滴定法或UV/可见光谱法)检测。鉴定存在的每个标记,然后确定是否存在表达的mRNA(及其丰度)。

另一种方法是在适宜的杂交条件下,将标记的DNA探针直接与固定的mRNA靶分子杂交。杂交步骤完成后,洗涤固相载体以除去任何未杂交的探针。然后从DNA探针/RNA双螺旋中水解RNA。该步骤可通过使用热使双螺旋变性或使用碱(即0.1 NNaOH)化学水解RNA而完成。由该步骤将得到可通过通常由凝胶电泳(例如聚丙烯酰胺凝胶电泳)或优选HPLC组成的大小分离步骤而分离的游离mRNA和其相应的DNA探针。然后将标记从DNA探针分子中裂解并用相应的检测技术(例如质谱法、红外光谱法、恒电势电流滴定法或UV/可见光谱法)检测。鉴定存在的每个标记,然后确定是否存在表达的mRNA(及其丰度)。

本发明优选的基因表达检测方法利用标记的寡核苷酸以及PCR(或其它同样有效的技术)、λ外切核酸酶、超滤和内部标准以提供有关基因表达的定量信息。下面将描述该优选的基因表达检测方法和其分步方法。

a.内部标准方法的描述

PCR是用于检测少量DNA或RNA(通过RT-PCR)的高度灵敏的方法。但是,靶的准确与精确定量很难,因为扩增产物的量并不总是

110

98809047.3说 明 书 第98/205页

与模板的量成正比。这是因为在一定数量的循环后,不论模板的量多少,PCR会达到其中扩增产物量几乎相同的“平台期”。在PCR期间使用内部标准,通过使用与靶模板相同的引物,共扩增已知量的内部标准模板,有助于解决该问题。由于这两个模板均使用相同的引物对,两种扩增产物量之间的比例反映了PCR扩增前靶与内部标准模板之间的初始比例。然后可从已知的内部标准模板量计算靶模板的量。

用于PCR检测的优选内部标准模板将以与靶模板相同的效率扩增。在内部标准模板中设计相同的引物位点以确保共扩增。通常从靶模板改变内部标准模板内引物之间的区域(例如缺失或加入10至20个碱基对)以便制成可通过凝胶电泳或酶辨别的模板。但是,这种修饰会引起模板扩增效率上的差异。通常制备并检测大量内部标准模板,直到得到几乎相同的扩增。

已经用CMST标记和hybotropes开发了内部标准检测方式。hybotrope描述于例如美国申请60/026,621(1996年9月24日申请);08/719132(1996年9月24日申请);08/933924(1997年9月23日申请);09/002051(1997年12月31日申请)和国际公开WO

98/13527,所有文献均全部引入本文作为参考。本质上讲,hybotrope指相对于标准盐溶液(即0.165 M NaCl),可使核酸双螺旋的焓增加20%或更多的任何化学物质。即当50%G+C的18bp寡核苷酸双螺旋在溶液中有15℃或更低的螺旋卷曲转换(HCT)时,所述化学物质就有hybotropic特性。HCT是当80%和20%的双螺旋是单链时的温度间的差异。然后选择退火温度为辨别温度,该温度是进行杂交反应的温度,在所述温度下进行的杂交反应可以可检测地区分错配的双螺旋和完全匹配的双螺旋。一定范围的温度可满足辨别温度的标准。

由于用hybotropes可完成高度特异性杂交,因此可以使用与靶模板有相同长度而仅有一个碱基对不同的优选内部标准模板。这是一个优选的内部标准,因为根据经验,它将与靶模板相同地共扩增。

111

98809047.3说 明 书 第99/205页

检测这种标准和靶扩增子混合物的一种优选方法是使用hybotrope缓冲液,以便使扩增子特异的标记寡核苷酸(优选CMST标记的,即含有用质谱法可检测的标记)与其相应的扩增子特异性杂交。为了检测扩增子的量,将每个扩增子特异的寡核苷酸用独特的质量标记标记。通过测量与内部标准和靶扩增子有关的质谱信号,确定扩增子的量。将已知量的内部标准加至样品中,用下列等式以及按照下文所述λ外切核酸酶和超滤方法得到的数据确定靶扩增子的量: (靶质量信号/内部标准质量信号)X内部标准量=靶量 b.λ外切核酸酶方法的描述

与DNA双螺旋保温后,λ外切核酸酶选择性地从5’磷酸化末端消化一条链,剩下的单链模板适于DNA测序。无需常规方法的艰苦尝试或优化不对称PCR的乏味,λ外切核酸酶就可制备单链测序模板。在存在含5’磷酸化末端的引物的条件下,通过扩增DNA,本领域技术人员可以得到带有5’磷酸化末端的DNA双螺旋。此后,通过沉淀或凝胶过滤纯化PCR产物以除去残留的引物和其它反应组分。然后用λ外切核酸酶选择性降解DNA双螺旋的磷酸化链,得到适于测序的单链的非磷酸化模板。加热使λ外切核酸酶失活后,将浓缩的单链DNA直接加至使用常规技术的杂交反应中。 c.超滤方法的描述

将从白细胞中收集的基因组DNA按照标准Rnase处理、蛋白酶K消化和酚:氯仿抽提以及用醋酸钠和乙醇沉淀法纯化。通过分光光度法确定浓度,然后制备0.01μg/μl的检测稀释液。将50μl DNA样品加在96孔“亲代”平板中。通过用8道取液器,以相同的形式从亲代平板中将1.5μl DNA转移到96孔平板或192孔平板中,制备成用于扩增反应的“子代”平板。然后加入18μl的液体蜡层(MJReasearch),将平板储存于4℃,在该温度下蜡固化,防止蒸发。

112

98809047.3说 明 书 第100/205页

为了开始PCR,取出子代平板并放在冰上以保持蜡为固体。这样在模板DNA和其它反应组分之间形成一屏障,直到将平板放在热循环器中并通过在第一循环中加热启动反应。以每个反应10-50μl的规模进行PCR。事先制备大量主要混合溶液并将所述溶液分成等份加至管中,所述管含有除标记特异性引物以外的所有PCR组分。用M13加尾的引物完成主要反应。M13加尾的引物是标准PCR引物对的一种修饰形式。这种修饰是将17个核苷酸加到正向引物的5’末端。该17个核苷酸序列与M13测序引物互补并有下列序列:5’-(NH2-C6)-AGGGTT TTC CCA GTC ACG AC-3’。该修饰使得可以在PCR反应中使用第三种寡核苷酸引物。所述第三引物通常按照本文所述的方法进行了标记。

超滤是用于蛋白质浓缩和脱盐的常用方法;它还是用于乙醇沉淀特别是少量核酸的另一种有效的方法,当沉淀核酸仅仅是为了改变溶剂时尤为如此。对于含磷酸盐或10mM EDTA的样品,超滤是一种值得考虑的节省时间的方法。通常,所述样品需初步透析以避免在乙醇沉淀过程中盐与核酸共沉淀下来。离心式微浓缩仪可在一个简单的步骤中将寡核苷酸探针或单链扩增子(和核酸)脱盐和浓缩。 Microcon

微浓缩仪对于浓缩50-500μl样品是理想的。在离心

式超滤中,用膜保留DNA。溶剂和盐通过并被除去。第二次倒置的Microcon离心可确保所需探针或核酸的最大DNA回收率。在浓缩寡聚体样品时,最重要的是避免高盐浓缩物,因为高盐浓度可促进单链核酸与基于纤维素的超滤膜发生结合。

典型的超滤条件如下:将DNA溶液(500μl)用Microcon-30浓缩仪以12000xg离心10分钟;将500μl TE缓冲液中的寡核苷酸溶液用Microcon-3装置以12000xg离心45分钟。将残余物通过倒置装置并以500-1000xg离心2分钟回收。相反,凝胶电泳需要将片段从凝胶片中分级分离、洗脱并脱盐。还需要有足够的物质以便于肉眼观察,而这有时很难达到,特别是在cDNA的情况下。这两种方法(凝胶电泳和透析)均费时并涉及许多样品加工步骤。

113

98809047.3说 明 书 第101/205页

在典型的杂交反应中,将探针以DNA片段浓度50至100倍摩尔过量加入。由于该原因,需要除去过量的未杂交探针。除去探针的常规方法包括凝胶过滤层析或凝胶电泳。凝胶过滤需要收集多个馏份进行分析、汇集和沉淀,这对于高处理量的检测是不可行的。但是,超滤是用于快速除去过量探针或PCR引物的另一种有效方法。在Amicon’s Centricon一次性浓缩仪中,将反应混合物通过超滤膜过滤,从而除去缓冲液和未杂交的探针或未延伸的引物。而膜保留下浓缩的片段。过滤的驱动力由固定角度的离心机以1000-5000xg离心提供。常规方法通常需要24小时的样品加工和2-3小时的试验时间。用Centricon,通常不到数小时就可纯化完样品。样品处理最少,并可同时加工许多样品。作为参考,可参见Krowczynska,A.M.“Effecient Purification of PCR Products usingUltrafiltration”BioTechniques 13(2):286-2,1992。 12.杂交技术

成功的基因克隆和测序可以通过检测不相关DNA或RNA分子的大组中该基因或其mRNA从而研究其结构和表达。组织中编码具体蛋白质的mRNA的量是基因活性的重要参数,而且与功能系统的活性显著相关。其调节作用取决于基因内序列(顺式作用因子)与序列特异性DNA结合蛋白(反式作用因子)之间的相互作用,所述蛋白质是组织特异性地或通过激素和第二信使系统激活的。

已有数种技术可用于分析特定基因、其调节序列、其特异性mRNA和其表达的调节;这些技术包括Southern或Northern印迹分析和核糖核酸酶(RNase)保护检测。

特定基因之核苷酸组成的变异与病理生理学非常有关。当位于非编码区域(5’、3’侧翼区域和内含子)内时,它们可以影响基因表达的调节,引起异常激活或抑制作用。当位于基因的编码区(外显子)内时,它们可以导致蛋白质功能的改变或者产生异常蛋白质。因此,基因内的特定序列可能与具体疾病有关并可作为所述疾病的标记。

114

98809047.3说 明 书 第102/205页

因此,在医学领域内一项主要研究目的是检测那些基因变异,将其作为诊断工具,并且获得有关理解病理生理学现象的重要信息。就特定基因内的变异而言,分析种群的基本方法是利用Southern印迹技术的DNA分析。简而言之,将制备的基因组DNA用酶(RE)消化,得到大量不同长度的DNA片段,通过基因组上该RE的特异性识别位点的存在来确定。在该位点内带有突变的特定基因的等位基因将被裂解成不同数目和长度的片段。将此称为片段长度多态现象(RFLP)并可作为有许多应用的重要诊断标记。待分析的片段必须从DNA片段库中分离并用特异性探针与其它DNA种类分开。因此,将DNA用琼脂糖凝胶进行电泳分级分离,然后转移并固定在尼龙或纤维素膜上。将固定的单链DNA与标记的DNA杂交,所述标记的DNA与待测DNA互补。除去非特异性杂交后,将所需的DNA片段按照探针特征肉眼观察(放射自显影或磷光成像分析)。 在本发明的一个实施方案中,提供了用类似于Southern印迹的技术鉴定例如生物样品中核酸分子或检测生物样品中选定的核酸分子的方法。简而言之,所述方法通常包括产生一系列标记的核酸片段的步骤,在所述步骤中将产生的片段用酶消化。通过将标记的探针与经消化的靶核酸杂交可产生标记的片段。杂交步骤可以在核酸酶消化前或之后进行。然后将所得的消化核酸片段通过大小分离。所述大小分离步骤可例如通过凝胶电泳(例如聚丙烯酰胺凝胶电泳)或优选HPLC完成。然后从分离的片段中裂解所述标记,再用相应的检测技术(例如质谱法、红外光谱法、恒电势电流滴定法或UV/可见光光谱法)检测所述标记。

可用Northern印迹分析和RNase保护检测法分析具体基因转录本的存在和量及其生理参数的调节。该方法的原理基础是总细胞RNA与特异性探针的杂交。在Northern印迹技术中,将一个组织的总RNA用HPLC或LC方法分级分离,并与标记的反义RNA(cRNA)(与待测RNA互补)杂交。应用严谨洗涤条件除去非特异性结合的分子。随后可按照所用探针的类型检测(质谱法或用电化学检测器)特异性结

115

98809047.3说 明 书 第103/205页

合的分子。另外,通过将检测mRNA的大小与所需mRNA的预测长度进行比较来控制特异性。

在本发明的一个实施方案中,提供了用类似Northern印迹的技术,鉴定例如生物样品中的核糖核酸分子或检测选定的核糖核酸分子的方法。简而言之,所述方法通常包括下列步骤:通过将标记探针与靶RNA杂交的步骤产生一系列标记的RNA。然后将标记的RNA分子通过大小分离。所述大小分离步骤可例如优选通过HPLC完成。然后从分离的RNA分子中裂解所述标记,再用相应的检测技术(例如质谱法、红外光谱法、恒电势电流滴定法或UV/可见光光谱法)检测所述标记。

检测mRNA种类最特异性的方法是RNase保护检测法。简而言之,将来自组织或细胞培养物的总RNA与完全同源的标记的特异性cRNA杂交。通过随后的RNase消化确定特异性。未杂交的单链RNA和非特异性杂交的甚至带有极少量错配的片段将被识别和裂解,而完全同源的双链RNA不被所述酶裂解因而受到保护。通过蛋白酶K消化和酚抽提除去RNase后,通常通过HPLC将特异性保护的片段与降解产物分开。

在本发明的一个实施方案中,提供了利用RNase保护检测法鉴定例如生物样品中核糖核酸分子或者用于检测选定的核糖核酸分子的方法。简而言之,所述方法通常包括下列步骤:将来自组织或细胞培养物的总RNA与标记的完全同源的特异性cRNA杂交、RNase消化、用蛋白酶K处理和酚抽提。从降解产物中分离标记的被保护RNA片段。所述大小分离步骤可通过例如LC或HPLC完成。然后从分离的RNA分子中裂解所述标记,再用相应的检测技术(例如质谱法、红外光谱法、恒电势电流滴定法或UV/可见光光谱法)检测。 13.突变检测技术

疾病的检测方法在预防和治疗中越来越重要。多因素疾病很难设计遗传检测试验,而200多种已知的人疾病是由单基因中的缺陷

116

98809047.3说 明 书 第104/205页

引起的,常常是一个氨基酸残基的改变(Olsen,Biotechnology:Anindustry comes of age.National Academic Press,1986)。许多这些突变产生引起疾病的单氨基酸改变。

灵敏的突变检测技术为突变筛选提供了极大的可能性。例如,甚至在受精卵植入前即可进行分析(Holding和Monk,Lancet 3:52,19)。越来越有效的遗传检测方法还能够筛选体检时从呼吸道或膀胱脱落的细胞中的致癌突变(Sidransky等,科学252:706,1991)。另外,当一种未知的基因引起遗传疾病时,检测DNA序列变体的方法可用于通过遗传连锁分析研究疾病的遗传。但是,检测和诊断个体基因中的突变具有技术和经济挑战。已经寻找了数种不同的方法,但是对于真正的广泛应用来说,没有一种是既有效又便宜的。 通过物理、化学或酶学方法可以鉴定样品中与单核苷酸有关的突变。通常,可将用于突变检测的方法分成适用于鉴定以前未知突变的扫描技术,和设计用于检测、区分或定量分析已知序列变体的技术。数种用于突变检测的扫描技术已经用错配的互补DNA链异源双链研究出来,所述异源双链是从野生型和突变序列衍生的,特别是在变性时表现出异常行为。可将该现象用于变性和温度梯度凝胶电泳(分别为DGGE和TGGE)方法中。甚至在单核苷酸位置的双螺旋错配也可以部分变性,使得在变性逐渐增加的变性梯度凝胶中电泳时,产生延迟迁移(Myers等,自然313:495,1985;Abrades等,Genomics 7:463,1990;Henco等,核酸研究18:6733,1990)。尽管可以检测突变,但是得不到有关突变的精确定位的信息。必须进一步分离突变形式并经DNA序列分析。或者,Rnase A可以在RNA探针和靶链不能正确配对的位置裂解异源双链。裂解的位点可以通过变性探针的电泳来确定。但是,某些突变可能检测不到,因为不是所有错配均可由Rnase有效裂解。双螺旋中的错配碱基对化学修饰也敏感。这些修饰可使链在错配的位点对裂解很敏感或者使聚合酶在随后的延伸反应中停止。化学裂解技术可以鉴定在长达2kb的靶序列中的突变并提供有关错配核苷酸近似位置的信息(Cotton等,

117

98809047.3说 明 书 第105/205页

PNAS USA 85:4397,1988;Ganguly等,核酸研究18:3933,1991)。但是,该技术相当费力并且不能鉴定突变的精确位置。

检测DNA链中突变的另一种策略是用一个修饰的核苷酸取代(合成过程中)一个正常的核苷酸,改变产物的分子量或其它物理参数。相对于野生型序列,带有增加或减少量的这种修饰核苷酸链表现出改变的电泳迁移率(Naylor等,Lancet 337:635,1991)。该技术可检测突变的存在,但不能确定位置。

另外两种方法通过改变凝胶迁移而显现DNA片段中的突变。在单链构型多态技术(SSCP)中,突变使变性的链具有不同的二级结构,由此影响其在非变性凝胶电泳过程中的迁移率。含内错配的异源双链DNA分子还可通过电泳与正确配对的分子分开(Orita,Genomics 5:874,19;Keen,Trends Genet.7:5,1991)。用上述技术,可以确定突变的存在,但不能确定位置。另外,这些技术中的许多不能区别单个和多突变。所有上述技术均可表明在有限的DNA片段中存在突变,而且其中一些技术可近似地确定突变在片段内的位置。但是,仍需要序列分析以阐明突变对所述片段编码潜力的影响。序列分析是非常有用的,例如可以筛选患病家族其它个体中的相同突变,在恶性疾病的情况下检测疾病的进程或者用于在自体移植前检测骨髓中残留的恶性细胞。尽管有这些优点,该方法由于费用很高,所以不可能作为常规诊断方法。

已经开发了大量其它技术以分析已知序列变体。对于筛选个体和普通群来说,有关这些可应用的分析方法的自动化和经济是非常重要的考虑因素。下述技术中,没有一项既经济、自动化,又具有所要求的特异性。

根据其对短寡核苷酸探针与靶序列杂交的去稳定化作用可以鉴定突变(参见Wetmur,Crit.Rev.Biochem.Mol.Biol.26:227,1991)。通常,该技术,等位基因特异性寡核苷酸杂交包括扩增靶序列,以及随后与短寡核苷酸探针杂交。因此,通过确定与固定化的寡核苷酸探针阵列的杂交模式可扫描扩增产物的许多可能的序列变

118

98809047.3说 明 书 第106/205页

体。但是,辨别核苷酸序列差别的大量其它策略的具体条件取决于鉴定序列差异的酶(Saiki,PNAS USA 86:6230,19;Zhang,核酸研究19:3929,1991)。

例如,酶识别约4-8个核苷酸的序列。以平均G+C含量为基础,一个DNA片段中,近一半的核苷酸位置可用100种酶监测。另一种方法是,用部分错配的PCR引物,可在可变位置周围产生人工酶识别序列。用该技术,可以仅仅识别突变或野生型序列,并在扩增后通过酶裂解(Chen等,分析生物化学(Anal.Biochem.)195:51,1991;Levi等,Cancer Res.51:3497,1991)。另一种方法利用在3’倒数第二的位置与靶序列错配的寡核苷酸引物作为PCR引物时表现出的能力降低的特性。但是,某些3’错配,特别是G-T的抑制性低于其它错配,这了它的应用。为了改进这种技术,在距3’末端的第三个位置上,将其它错配掺入到引物中。这样,在与一个等位基因变体杂交之引物的三个3’核苷酸中,有两个错配的位置,而当引物与另一等位基因杂交时,在距3’末端的第三个位置上有一个错配(Newton等,核酸研究17:2503,19)。需要确定可显著促进1bp错配扩增的扩增条件。

DNA聚合酶还用于通过确定哪个核苷酸被加入到靶链中可变位置紧上游的寡核苷酸引物中,来辨别等位基因序列变体。

已开发了一种连接检测方法。在该方法中,将在靶链上并列紧邻杂交的两个寡核苷酸探针通过DNA连接酶连接起来。如果在两个寡核苷酸探针毗邻处有错配,则连接作用受到抑制。 14.用于突变检测的检测方法

突变是基因组DNA中的单碱基对改变。在本发明中,通过与同研究序列互补的寡核苷酸探针杂交,可以很容易检测大部分的这种改变。在此所述的系统中,应用两个寡核苷酸检测一个突变。一个寡核苷酸具有野生型序列,另一个寡核苷酸具有突变序列。当将所述两个寡核苷酸用作野生型靶基因组序列的探针时,所述野生型寡

119

98809047.3说 明 书 第107/205页

核苷酸将产生完全的碱基配对结构,而突变寡核苷酸序列将形成带有一个碱基对错配的双螺旋。如上所述,野生型与错配双螺旋的Tm之间6-7℃的差异使得可以很容易鉴定或区别这两种类型的双螺旋。为了实现这种区分,在相应的hybotropic溶液中于错配双螺旋的Tm下完成杂交(有关hybotropic溶液的描述参见例如美国申请Nos.60/026621(1996年9月24日申请);08/719132((1996年9月24日申请);08/933924(1997年9月23日申请);09/002051,1997年12月31日申请);和国际公开WO 98/13527,均全部引入本文作为参考)。然后测量该组寡核苷酸探针的杂交程度。在测量野生型探针与错配探针的杂交程度比例时,得到10/1至大于20/1的值。有这样的结果即可开发用于突变检测的实用检测方法。

为了举例,用于突变检测的一种检测形式使用靶核酸(例如基因组DNA)和跨所研究区域的寡核苷酸探针。所述寡核苷酸探针大于或等于24nt长(最长约36nt),并在所述寡核苷酸探针的3’或5’末端用荧光染料标记。通过在相应的杂交溶液中溶解组织培养细胞、组织、生物体等得到靶核酸。然后,将溶解的溶液加热至使靶核酸变性的温度(比靶核苷酸双螺旋Tm值高15-25℃)。在变性温度下加入寡核苷酸探针,然后在错配双螺旋的Tm值下进行0.5-24小时的杂交。然后收集基因组DNA并通过GF/C(GF/B等)玻璃纤维滤膜。然后,将所述滤膜用相应的杂交溶液洗涤以除去任何未杂交的寡核苷酸探针(RNA,短寡核苷酸和核酸在这些条件下不与玻璃纤维滤膜结合)。然后可以从靶DNA中热洗脱杂交的寡核苷酸探针并进行测量(例如通过荧光)。对于需要极高灵敏度的检测方法,将探针浓缩并测量。

可以使用其它高度灵敏的杂交方法。本发明方法可以很容易检测细胞、样品等中怀疑存在的含有突变的核酸,即靶核酸。所述靶核酸含有脱氧核糖核酸(DNA)或核糖核酸(RNA)的核苷酸序列,所述核苷酸序列的存在比较有意义,并用杂交检测方法检测其是否存在。还可将本发明的杂交方法用于核酸的复杂生物学混合物(RNA和

120

98809047.3说 明 书 第108/205页

/或DNA)。所述复杂的生物学混合物包括各种真核和原核细胞,包含原生质体;和/或含有多核苷酸核酸的其它生物材料。因此,所述方法可用于组织培养细胞、动物细胞、动物组织、血液细胞(例如网织红细胞、淋巴细胞)、植物细胞、细菌、酵母、病毒、支原体、原生动物、真菌等。通过检测已知来源的核酸探针之间的特异性杂交,可以确定靶核酸的特异性存在。用于检测核酸的复杂群中的靶核酸的典型杂交检测方法如下所述:将靶核酸在LC或HPLC上通过大小分离,克隆并分离,再分成组,或就作为复杂群。在本发明的一个实施方案中,提供了鉴定核酸分子和检测例如生物样品中的选定核酸分子的方法。简单地说,该方法通常包括下述步骤:克隆和分离靶核酸,再分成组,或就作为复杂群体。在上述条件下将靶核酸与标记的寡核苷酸探针杂交。然后用LC或HPLC将所述靶核酸按照大小分离。从分离的片段中裂解标记,然后用相应的检测技术(例如质谱法、红外光谱法、恒电势电流滴定法或UV/可见光分光光度法)检测所述标记。 15.杂交测序

常规通过将引物与靶DNA杂交,然后用聚合酶进行链延伸来完成DNA序列分析。通过包含双脱氧核苷酸来控制特异性停止。在该类分析中,可通过在退火缓冲液中加入hybotrope和/或在引物中掺入非碱基残基并在辨别温度退火来提高引发的特异性。

在本发明的一个实施方案中,提供了通过普通测序技术鉴定例如生物样品中核酸分子或检测生物样品中选定的核酸分子的方法,所述测序技术利用Sanger法的杂交。简而言之,所述方法主要包括将标记的引物与靶DNA杂交并用聚合酶完成链延伸的步骤。通过掺入同样可被标记的双脱氧核苷酸来控制特异性停止。从将靶核酸通过HPLC按照大小分离。将所述标记从分离的片段中裂解,并用相应的检测技术(例如质谱法、红外光谱法、恒电势电流滴定法或UV/可见光分光光度法)检测。其它序列分析法包括将靶与各种各样的随机

121

98809047.3说 明 书 第109/205页

短寡核苷酸杂交。通过重叠杂交分析构建序列。在该技术中,精确杂交是最基本的。hybotrope或非碱基残基的使用以及在辨别温度下退火有利于该技术减少或消除错配杂交。目的是开发自动化的杂交方法以探测寡核苷酸探针大阵列或核酸样品大阵列。所述技术的应用包括基因作图、克隆鉴定、医学遗传学和基因发现、用杂交进行DNA序列分析并最终测序确定。许多参数都必须受到控制以便自动或多路复用使用寡核苷酸探针。相应探针的稳定性必须类似,当探针很短(即6至50个核苷酸)时,与靶核酸的错配程度、温度、离子强度、探针(或靶)的A+T含量以及其它参数应类似。通常,应调整试验条件和探针的序列,直到完全碱基配对的探针的形成在热力学上优于含错配的任何双螺旋。很大规模的应用探针例如通过杂交测序(SBH)或者检测高度多态的座位例如囊性纤维变性跨膜蛋白位点需要更严格地控制多路复用探针。在本发明的一个实施方案中,提供了利用通过杂交的普通测序技术,鉴定例如生物样品中的核酸分子或者检测例如生物样品中的选定核酸分子的方法。简而言之,所述方法主要包括在仔细控制的条件下,将一系列标记的引物与DNA靶或者一系列靶DNA片段杂交。将所述靶核酸用HPLC按照大小分离。然后从分离的片段中裂解所述标记,再用相应的检测技术(例如质谱法、红外光谱法、恒电势电流滴定法或UV/可见光谱法)检测所述标记。

16.寡核苷酸连接检测法

寡核苷酸连接检测法是一种以PCR为基础的筛选方法的延伸,它使用基于ELISA的检测方法(OLA,Nickerson等,Proc.Natl.Acad.Sci.USA 87:23,1990)以便检测含靶序列的PCR产物。因此,消除了凝胶电泳和菌落杂交步骤。简而言之,OLA使用两个相邻的寡核苷酸:“报告”探针(在5’末端被标记)和5’-磷酸化/3’-生物素化的“锚定”探针。将与PCR引物内的序列互补的该两种寡核苷酸与靶DNA退火,如果有完全的互补性,T4 DNA连接酶能连接这两

122

98809047.3说 明 书 第110/205页

个探针。将生物素化的锚定探针捕获在固定的链霉抗生物素上,并分析共价连接的报告探针以检测在PCR产物中是否存在靶序列。在本发明的一个实施方案中,提供了利用寡核苷酸连接检测法鉴定例如生物样品中的核酸分子或者检测例如生物样品中的选定核酸分子的方法。简而言之,所述方法主要包括下列步骤:在靶DNA上完成PCR,然后与5’标记的报告DNA探针和5’磷酸化/未生物素化的探针杂交。将样品与T4 DNA连接酶一起保温。通过例如LC或HPLC,可以将带有连接上的探针的DNA链与带有未连接的探针的DNA分离开。从分离的片段中裂解标记,然后通过相应的检测技术(例如质谱法、红外光谱法、恒电势电流滴定法或UV/可见光谱法)检测所述标记。OLA检测的最新进展使得可以同时分析多个样品和多个突变。(Baron等,Nature Biotechnology 87:1279,1996)。简而言之,所述方法包括通过PCR扩增含所研究突变的基因片段。然后将PCR产物与一个通用探针及两个等位基因特异性的寡核苷酸探针(一个含有突变,而另一个不含有)杂交,从而使等位基因特异性探针的3’末端与通用探针的5’末端紧邻。这样在每个座位上,在两个等位基因探针和通用探针之间建立了一种竞争性杂交-连接方法。然后,耐热的DNA连接酶辨别连接位点处的单碱基错配,由此产生等位基因特异性连接产物。将通用探针用四种荧光团之一进行标记,而每个等位基因特异性探针用一种或多种五亚乙基氧化物

(pentaethyleneoxide)迁移率修饰尾进行标记,所述尾在所述不同的等位基因特异性探针之间提供大小差异。然后,依据修饰尾的大小通过凝胶电泳分离样品,并通过探针上的荧光标记进行检测。通过利用等位基因特异性探针的大小差异和通用探针可供使用的四种荧光团,可以在一个电泳凝胶泳道上分析许多样品。在本发明的一个实施方案中,提供了利用用于同时多样品检测的寡核苷酸连接检测技术,鉴定例如生物样品中的核酸分子或检测例如生物样品中的选定核酸分子的方法。简而言之,所述方法主要包括下列步骤:对靶DNA完成PCR,然后,按照本发明说明与通用探针(未标记的)和

123

98809047.3说 明 书 第111/205页

两种标记的等位基因特异性探针杂交。将所述样品与DNA连接酶一起保温,然后通过例如优选LC或HPLC分离片段。从分离的片段中裂解所述标记,再用相应的检测方法(例如质谱法、红外光谱法、恒电势电流滴定法或UV/可见光分光光度法)检测所述标记。 17.示差显示 a.综述

哺乳动物,例如人,在其基因组中约有100,000个不同的基因,其中每个细胞中仅少部分,可能15%得到表达。基因的选择性表达决定了任何给定细胞或组织的生物化学特征。正常细胞生长和分化过程,以及引起疾病如癌症的病理学改变都是由基因表达的改变引起的。示差显示方法可以鉴定在各种细胞中特异性表达的基因。 示差显示用经设计与poly(A)尾之5’边界结合的引物和结合上游的任意序列引物,扩增相应cDNA的3’末端部分。通过大小分离方法(PAGE、HPLC等)观察用各引物对扩增的群组,可以直接比较所研究的两个生物样品间的mRNA。示差显示方法能够肉眼观察在哺乳动物细胞中的所有表达基因(约10,000至15,000种mRNA)并能够进行序列分析。对下述进行比较是有可能的:(1)亲本中扩增的总峰数,(2)亲本之间的多态峰数,和(3)动物或植物杂交子代中多态峰的分离比。示差显示还可用于鉴定各种刺激后已知或未知的上调和下调基因。可将示差显示PCR片段用作cDNA克隆的探针(从cDNA或基因组文库中发现未知基因)。

简而言之,示差显示的步骤如下:1)从所研究的生物样品中分离RNA。可以用总RNA、细胞质RNA或mRNA。2)用锚定oligo

dT(oligodTdN,其中N是A、C或G)产生第一链cDNA。3)用oligo dTdN和任意序列的短引物扩增cDNA。为了对所研究的两种细胞群或者两种样品进行完全的示差显示分析,需要9种不同的引物。具体mRNA的示差显示的检测限度为小于总mRNA群的0.001%。

由于本文所述方法的简单性、灵敏性和可重现性,CMST示差显

124

98809047.3说 明 书 第112/205页

示方法比传统的凝胶为基础的系统有显著的优越性。用基于CMST的示差显示分析两种细胞类型,×24个PCR连续过程可迅速完成,而用传统方法完成这么大的量则费时费力。此外,已发现从示差显示凝胶分离的条带的序列不均匀性是这种技术失败率高的原因之一。但是用本文所述的基于CMST的示差显示方法可完全避免这种情况。

b.基于CMST的示差显示实例

用于示差显示的原材料是从两种不同细胞群分离的RNA。一般来说,细胞的来源相似,不同只是细胞的药物处理方面、是“正常的”还是“转化的”或者其各种导入基因的表达方面。

收集植物组织或动物材料(2-3g),然后在无菌培养皿中磨碎或剁碎。然后用预冷的杵和研钵在液氮下,将材料磨成细粉。将1克冷冻粉末转移至含8毫升热(80℃)的比例为1∶1的RNA提取缓冲液(100mM Tris-HCl(pH8.0),100mM LiCl,10mM EDTA,1.0%LiDS)和酚(基础体积:4毫升)混合物的12毫升聚丙烯管(1克=约5毫升粉末)中。将样品以高速混合(旋转)至少30秒。加入氯仿(4毫升),再混合并在离心机中以5000至10000xg离心20分钟。将液相转移至12毫升的管中,加入1/3体积的冷8M LiCl以沉淀RNA(0℃,3小时)。在0℃将RNA离心20分钟,然后重悬在1毫升水中。通过用Dnase I处理RNA样品除去残留的基因组DNA。用500ng无RNA的DNA,在1x反转录缓冲液,10mM DTT,20μM dNTP,0.2μM

5’RSH-T11C(带有5’位点的一碱基锚定引物),200U MoMuLV反转录酶和1.5U RNA Guard/20μl反应体积中对每个RNA样品进行反转录。

尽管使用下游引物将cDNA亚组份的数量减少至3,但是并不能减少显示组中大部分cDNA种类所需的PCR反应数。相反,这样可减少鉴定存在的cDNA种类的理论机会。用9种不同的DMO-VV型引物组合,可得到最好的结果,其中V可以是A、G、C,但不能是T。在

125

98809047.3说 明 书 第113/205页

末端3’位置有一个T,引物的不完全杂交会导致凝胶上的条带模糊。RNA的最佳浓度是200-300ng/cDNA合成。

基本上按照以前所述(Liang和Pardee,科学257:967-971,1992)完成基于CMST的示差显示,不同之处在于用于反转录和扩增步骤的引物的设计、放射性标记的核苷酸的选择。用9种下游引物和24种上游引物对来自两种研究中的生物样品的cDNA进行完全示差显示分析将产生9×24×2个基于CMST的示差显示反应。可以将扩增产物用HPLC分离,如果需要可再扩增。

将RNA在65℃保温5分钟后,将样品在冰上猝冷,加至反转录混合物中,在37℃保温60分钟,然后95℃保温5分钟。然后用相同的5’引物和一系列13聚体的任意但确定的下述序列扩增双份cDNA样品:H-AP:AAGCTTCGACTGT,H-AP:AAGCTTTGGTCAG,H-AP4:AAGCTTCTCAACG,H-AP5:AAGCTTAGTAGGC。

在含0.1倍体积反转录反应液、1xPCR缓冲液(10x PCR缓冲液=100mM TRIS-HCl,15mM MgCl2,10mM KCl pH8.3),2μM dNTP,0.2μM RS H-T11C锚定引物,0.2μM适宜的任意引物,1.5U ExpandTM高保真DNA聚合酶和水至20μl终体积的反应混合物中完成扩增。在下列条件下完成cDNA的扩增:94℃(1分钟),然后40个循环的94℃(30秒)、40℃(2分钟)、72℃(30秒),最后是72℃(5分钟)。 用跨已知内含子/外显子边界的基因特异性引物完成每个基因的扩增(见下文)。所有扩增均在含10mM Tris HCl pH8.3,1mM NH4C1,1.5M MgCl2,100mM KCl,0.125mM NTP,10ng/ml相应的寡核苷酸引物和0.75单位Taq DNA聚合酶(Gibco-BRL)的20μl反应液中进行。循环参数是94℃预热5分钟,然后94℃变性1分钟,55℃退火2分钟,72℃延伸30秒至1分钟,最后在72℃延伸10分钟。扩增循环通常是30-45个。

在0.04M Tris-acetate,0.001 M EDTA(1xTEA)缓冲液中的1%琼脂糖凝胶上,通过凝胶纯化扩增产物(Zhen和Swank,

Biotechniques 14:4-8,1993),然后用溴化乙锭染色。在所

126

98809047.3说 明 书 第114/205页

研究条带的前沿切下一槽,灌入于1xTAE缓冲液中的50-200μl 10%PEG。继续电泳直到所述带完全进入该槽中。然后取出内含物,用酚提取,氯仿抽提,并在0.1体积7.5M乙酸铵和2.5体积100%EtOH中沉淀。将样品用75%EtOH洗涤并在室温下稍作干燥。通过在1xTBE缓冲液中的1%琼脂糖凝胶上电泳少量等份样品,用溴化乙锭染色,然后与已知标准比较来定量分析产率。

用HPLC分析扩增反应的产物。用自动的HPLC仪器(Rainin,Emeryville,CA.,或Hewlett Packard,Palo Alto,CA)完成HPLC。将在注射到HPLC前于95℃变性3分钟的未纯化DNA指纹产物以0.9ml/分钟的流速用1.8%/分钟的线性乙腈(ACN,J.T.Baker,NJ)梯度洗脱。按照扩增产物的大小调整起点和终点。成功辨别在DNA指纹技术过程中产生的分子所需的温度是50℃。然后将HPLC的洗脱液直接加至质谱仪(Hewlett Packard,Palo Alto,CA)中检测标记。 色谱图(质谱图)比较表明在受刺激的Jurkat细胞中观察到220bp和468bp的条带,而在未受刺激的Jurkat细胞中则观察不到。 C.核酸片段的分离

需要分析的样品常常是在复杂基质中的多组分混合物。例如,对于含未知化合物的样品,必须将组分彼此分开以便可以用其他分析方法鉴定每个组分。混合物中各组分的分离特性在恒定的条件下是恒定的,因此,一旦确定,就可用这样的条件鉴定并定量分析每种组分。这种方法在层析和电泳分析分离中是典型的。 1.高效液相层析(HPLC)

高效液相层析(HPLC)是用于分离溶解于溶液中的化合物的层析分离技术。HPLC仪器由移动相贮池、泵、注射器、分离柱和检测器组成。通过将一份样品混合物注射到柱上可分离化合物。混合物中的不同组分由于其在移动相和固定相中分配行为上的差异,因此以不同的速率通过柱。

127

98809047.3说 明 书 第115/205页

最近,已表明在带有化学键键合之烷基链的无孔PS/DVB颗粒上的IP-RO-HPLC是单链和双链核酸分析中可替代毛细管电泳的另一种快速的方法,可提供相似的分辨率(Huber等,分析生物化学212:351,1993;Huber等,1993,核酸研究21:1061;Huber等,Biotechniques 16:8,1993)。离子交换层析不总是作为链长度的函数保持双链DNA状态(因为AT碱基对与带正电荷的固定相的相互作用比与GC碱基对的相互作用更强),与离子交换层析相反,IP-RO-HPLC能够进行严格的大小依赖性分离。

用100mM醋酸三乙基铵作为离子配对试剂,已开发了一种方法,可在烷基化的无孔2.3μM聚(苯乙烯-二乙烯苯)颗粒上通过高效液相层析成功地分离磷酸二酯寡核苷酸(Oefner等,分析生物化学223:39,1994)。所述技术可以分离50-200个核苷酸的长度范围内仅有4-8个碱基对不同的PCR产物。 2.电泳

电泳是以离子(或在本文所述的情况下是DNA)在电场中的迁移率为基础的分离技术。带负电荷的DNA向正极迁移,而带正电荷的离子向负极迁移。出于安全的考虑,一个电极通常接地,另一个带正电或带负电。带电的物质根据其总电荷数、大小和形状而有不同的迁移速率,因此,可以得到分离。电极装置由高压电源、电极、缓冲液和缓冲液支持物如聚丙烯酰胺凝胶或者毛细管组成。对于许多样品可使用开放的毛细管,而其它凝胶支持物通常用于诸如蛋白质混合物或DNA片段之类的生物样品。 3.毛细管电泳(CE)

各种形式的毛细管电泳(CE)(自由溶液、等速电泳、等电聚焦、聚丙烯酰胺凝胶、胶束电动毛细管层析)正逐渐发展为快速、高分辨地分离极少量复杂混合物的方法。与MS的内在灵敏性和选择性相结合,CE-MS是用于生物分析的一种有力的技术。在本文所述的新应

128

98809047.3说 明 书 第116/205页

用中,这两种方法的结合将得到更优越的DNA测序方法,该新方法将优于现有的测序方法好几个数量级。

CE与电喷射离子化(ESI)流速之间的对应关系和这两者均可由溶液中的离子促进(并主要用于所述离子)的事实为一种极富吸引力的组合提供了基础。已经描述了毛细管区域电泳(CZE)和毛细管等速电泳与基于ESI的四极质谱仪的组合(Olivares等,Anal.Chem.59:1230,1987;Smith等Anal.Chem.60:436,1988;Loo等,Anal.Chem.179:404,19;Edmonds等,J.Chroma.474:21,19;Loo等,J.Microcolumn Sep.1:223,19;Lee等,J.Chromatog,458:313,1988;Smith等,J.Chromatog.480:211,19;Grese等,J.Am.Chem.Soc.111:2835,19)。小肽很容易适合于CZE分析,有良好(飞摩尔)的灵敏度。

最有效的DNA片段分离方法是通常以板凝胶形式进行的聚丙烯酰胺凝胶电泳(PAGE)。但是,现有技术的主要是凝胶电泳处理测序反应中产生的DNA片段需要相对较长的时间。利用使用超薄凝胶的毛细管电泳可提高很多倍(10倍)。在第一近似值的自由溶液中,所有DNA均以与加入一种碱导致质量和电荷补偿的相同迁移率迁移。在聚丙烯酰胺凝胶中,DNA片段作为长度的函数过筛和迁移,而且现已将这种方法用于CE。现用交联聚丙烯酰胺已达到每米相当数量的塔板数(10个塔板/米,Cohen等,Proc.Natl.Acad.Sci.USA 85:9660,1988)。所述的CE柱可用于DNA测序。理论上,在标准测序仪中,CE法比板凝胶电泳快25倍。例如,每小时可以读约300个碱基。在板凝胶电泳中,分离速度受可施加于凝胶上而不会过量产生热的电场强度的。因此,使用更高的场强(在CE中为300V/cm,在板凝胶电泳中为10V/cm)可以达到更高速度的CE。毛细管方式可降低安培数,由此可降低功率和引起的热产生。

Smith和其他人(Smith等,核酸研究18:4417,1990)建议并联使用多个毛细管以提高处理量。同样,Mathies和Huang(Mathies和Huang,自然359:167,1992)已介绍了在平行排列的毛细管上进

129

-7

98809047.3说 明 书 第117/205页

行分离的毛细管电泳并证明有高处理量的测序结果(Huang等,Anal.Chem.:967,1992,Huang等,Anal.Chem.:2149,1992)。毛细管电泳的主要缺陷是可加到毛细管上的样品量有限。分离前,在毛细管电泳开始时通过浓缩量大的样品,可提高负载能力,检测水平可降低数个数量级。在CE中,最通用的预浓缩方法是样品堆积。已经对样品堆积进行了综述(Chien and Burgi,Anal.Chem.:4A,1992)。样品堆积取决于样品缓冲液和毛细管缓冲液之间的基质差异(pH、离子强度),这样跨样品区的电场比毛细管区的大。在样品堆积中,将低浓度缓冲液中的大体积样品注入毛细管柱的顶部预浓缩。向毛细管中灌入相同组分、但浓度更高的缓冲液。当样品离子到达毛细管缓冲液和较低的电场区时,它们堆积成一个浓缩区。样品堆积使检测能力提高1-3个数量级。

预浓缩的另一种方法是对分析物进行自由区CE分离前进行等速电泳(ITP)。ITP是一种可以将微升体积的样品负载到毛细管上的电泳技术,与一般CE的低nL注射体积相反。该技术依赖于将样品插入到迁移率分别比被分析物高和低的两种缓冲液(引导和示踪电解质)之间。该技术本身是一种浓缩技术,其中将被分析物浓缩成以相同速度迁移的纯区。目前,该技术不如上述的堆积技术常用,原因是需要多次选择引导和示踪电解质,并且在分离过程中仅能分离阳离子或阴离子。

DNA测序方法的核心是显著地选择电泳分离DNA或寡核苷酸片段。这项技术很有意义,因为每个片段都仅因核苷酸的不同而分辨。已经可以分离高达1000个片段(1000bp)。用可裂解标记的测序方法有如下的其他优点。当使用可裂解标记时,用聚丙烯酰胺凝胶电泳分离DNA片段时不需要使用板凝胶方式。由于大量的样品(4至2000)混合在一起,因此不需要象目前的染料-引物或染料-终止子方法(即ABI 373测序仪)一样平行跑样品。由于不需要跑平行道,因此,也就不需要使用板凝胶。因此在电泳分离时可使用管凝胶形式。Grossman(Grossman等,Genet.Anal.Tech.AppL 9:9,1992)

130

98809047.3说 明 书 第118/205页

已说明,当用管凝胶形式代替板凝胶形式时,有很多优点。这是由于与板凝胶相比,管形式更能散失焦耳热,这样跑得更快(快50%),对大分子量DNA片段(大于1000nt)的分辨率更高。在基因组测序中较长地阅读是很重要的。因此,在测序中应用可裂解标记可以为使用者提供具有最大分辨率的最有效和灵敏的DNA分离方法。 4.微装配的装置

毛细管电泳(CE)是一种有效的DNA测序、法庭分析、PCR产物分析和片段大小分析方法。由于毛细管凝胶可以使用很高的电场,因此,CE比传统板PAGE快得多。但是,CE有每块凝胶只能处理一个样品的缺陷。本方法结合了CE的快速分离与同时分析多个样品的能力。使用微装配装置的基础概念是通过将泳道尺寸最小化至约100微米而提高电泳中信息密度的能力。电子工业通常使用微装配工艺以制造不到1微米大小的电路。毛细管阵列的现有密度受毛细管外径的。通道的微装配化产生了更高密度的阵列。微装配化还可以得到用玻璃纤维不可能得到的物理装配,并在芯片上将通道与其他装置相连。在微芯片上构建的用于分离技术的装置较少。已在硅芯片上制造了气相色谱仪(Terry等,IEEE Trans.ElectronDevice,ED-26:1880,1979)和液相色谱仪(Manz等,Sens.

Actuators B1:249,1990),但是,这些装置未得到广泛应用。一些研究小组已报道了在微装配装置上分离荧光染料和氨基酸(Manz等,J.Chromatography 593:253,1992,Effenhauser等,Anal.Chem.65:2637,1993)。最近,Woolley和Mathies(Woolley and Mathies,Proc,Natl.Acad.Sci.91:11348,1994)已说明了可用于在玻璃底物上制造大量分离通道的光刻法和化学蚀刻法。用羟乙基纤维素(HEC)分离基质填充通道。已表明可以在两分钟内分离DNA片段。

D.标记的裂解

131

98809047.3说 明 书 第119/205页

如上所述,不同的接头设计可以赋予在不同的特定物理或化学条件下的可裂解性(“不稳定性”)。可以裂解各种接头的条件的例子包括酸、碱、氧化、还原、氟化物、硫醇交换、光解或酶催化条件。

满足上列接头一般标准的可裂解接头的例子是本领域技术人员熟知的,包括Pierce(Rockford,IL)的目录中所列的。其例子包括: ●  二(琥珀酰亚氨基琥珀酸)乙二醇酯(EGS),一种可以被羟     胺裂解(1M,37℃下3-6小时)的胺反应性交联剂; ●  酒石酸二琥珀酰亚氨酯(DST)和磺基-DST,可以被0.015M     高碘酸钠裂解的胺反应性交联剂;

●  二[2-(琥珀酰亚氨基氧羰基氧基)乙基]砜(BSOCOES)和     磺基-BSOCOES,可以被碱(pH11.6)裂解的胺反应性交联     剂;

●  1,4-二-[3’-(2’-吡啶二硫基(丙酰氨基)丁烷]     (DPDPB),可以通过硫醇交换或还原裂解的吡啶二硫醇交     联剂;

●  N-4-[(对叠氮基水杨酰氨基)-丁基]-3’-(2’-吡啶二硫基)     丙酰胺(APDP),一种可以通过硫醇交换或还原裂解的吡     啶二硫醇交联剂;

●  二-[β-4-(叠氮基水杨酰氨基)乙基]-二硫化物,一种可以     通过硫醇交换或还原裂解的光反应性交联剂; ●  N-琥珀酰亚氨基-4-(叠氮基苯基)-1,3’-二硫丙酸酯     (SADP),一种可以通过硫醇交换或还原裂解的光反应性交     联剂;

●  磺基琥珀酰亚氨基-2-(7-叠氮基-4-甲基香豆素-3-乙酰     胺)乙基-1,3’-二硫丙酸酯(SAED),一种可以通过硫醇交     换或还原裂解的光反应性交联剂;

●  磺基琥珀酰亚氨基-2-(间叠氮基-邻硝基苯甲酰氨基)-乙     基-1,3’-二硫丙酸酯(SAND),一种可以通过硫醇交换或

132

98809047.3说 明 书 第120/205页

还原裂解的光反应性交联剂。

可用于释放标记的其它可裂解接头和裂解条件的例子如下。甲硅烷基连接基团可以通过氟化物或酸性条件裂解。3-、4-、5-或6-取代的-2-硝基苄氧基或2-、3-、5-或6-取代的-4-硝基苄氧基连接基团可以通过光解进行裂解。3-、4-、5-或6-取代的-2-烷氧基苯氧基或2-、3-、5-或6-取代的-4-烷氧基苯氧基连接基团可以用Ce(NH4)2(NO3)6(氧化)裂解。NCO2(尿烷)接头可以用氢氧化物(碱)、酸或LiAlH4(还原)裂解。3-戊烯基、2-丁烯基或1-丁烯基连接基团可以用O3、OsO4/IO4或KMnO4(氧化)裂解。2-[3-、4-或5-取代的呋喃基]氧基连接基团可以通过O2、Br2、MeOH或酸裂解。

裂解其它不稳定连接基团的条件包括:叔烷氧基连接基团可以通过酸裂解;甲基(二烷基)甲氧基或4-取代的-2-烷基-1,3-二氧戊环-2-基连接基团可以通过H3O裂解;2-甲硅烷基乙氧基连接基团可以通过氟化物或酸裂解;2-(X)-乙氧基(其中X=酮基、酯、酰胺、氰基、NO2、硫化物、亚砜、砜)连接基团可以在碱性条件下裂解;2-、3-、4-、5-或6-取代的-苄氧基连接基团可以用酸或在还原条件下裂解;2-丁烯氧基连接基团可以用(Ph3P3)RhCl(H)裂解;3-、4-、5-或6-取代的-2-溴苯氧基连接基团可以用Li、Mg、BuLi裂解;甲硫基甲氧基连接基团可以用Hg裂解;2-(X)-乙氧基(其中X=卤素)连接基团可以用Zn或Mg裂解;2-羟基乙氧基连接基团可以通过氧化(例如用Pb(OAc)4)裂解。

优选可以通过酸或光解裂解的接头。开发的多种用于固相肽合成的对酸不稳定的接头可用于将标记与MOI连接。其中的一些接头记载于Lloyd-Williams等最近所作的综述(四面体,49:11065-11133,1993)中。一种有用的接头是基于对烷氧基苄醇,其中的两种接头4-羟基甲基苯氧基乙酸和4-(4-羟甲基-3-甲氧基苯氧基)丁酸,可从Advanced ChemTech(Louisville,KY)购买到。这两种接头均可以通过与苄醇之间的酯键连接到标记上,以及通过与羧酸之间的酰胺键连接到含胺的MOI上。通过这些分子连接的标记可以用

133

2++

-

98809047.3说 明 书 第121/205页

各种浓度的三氟乙酸从MOI上释放。这些接头的裂解导致标记上羧酸的释放。将通过相关接头如2,4-二甲氧基-4’-(羧基甲氧基)二苯甲胺(可从Advanced ChemTech以FMOC保护的形式得到)连接的标记进行酸裂解导致释放的标记上羧酰胺的释放。

大部分用于本申请的光不稳定性接头也是为了固相肽合成而开发的(参见Lloyd-Williams的综述)。这些接头通常是基于2-硝基苄酯或2-硝基苯甲酰胺。最近在文献中报道的两种光不稳定性接头的例子是4-(4-(1-Fmoc-氨基)乙基)-2-甲氧基-5-硝基苯氧基丁酸(Holmes和Jones,有机化学杂志,60:2318-2319,1995)和3-(Fmoc-氨基)-3-(2-硝基苯基)丙酸(Brown等,分子多样性1:4-12,1995)。这两种接头均可以通过羧酸连接到MOI的胺上。标记与接头的连接是通过标记上的羧酸与接头上的胺形成酰胺来实现的。光不稳定性接头的裂解通常用波长为350nm的紫外光来进行,所用强度和时间是本领域技术人员公知的。用于光化学裂解的仪器的商业来源的例子是Aura Industries Inc.(Staten Island,NY)和Agrenetics(Wilmington,MA)。接头的裂解导致标记上伯酰胺的释放。可被光裂解的接头的例子包括硝基苯基甘氨酸酯、外-和内-2-苯并降冰片烯基氯化物和甲磺酸酯、3-氨基-3-(2-硝基苯基)丙酸。酶催化裂解的例子包括可以裂解酯键的酯酶、可以裂解磷酸二酯键的核酸酶、可以裂解肽键的蛋白酶等。

可用于对标记的分子进行光裂解的适宜装置包括:字首组合词为“PHRED”的装置,“PHRED”代表的是增强检测光化学反应器,该装置可从Aura Industries,Staten Island,NY得到(带有254nm和366nm的灯泡);带有Luxtube组件的PhotoBlaster System-1,该装置可从Agrenetics,81 Salem Street Wilmingtom MA USA 01887得到(带有366nm的灯泡,但其管线含有可被366nm光线激活的光催化剂,从而发射出包括254nm的波长范围)。E.标记的检测

134

98809047.3说 明 书 第122/205页

在某些类型的光谱学领域,检测方法通常依赖于吸收和发射。当原子或分子吸收光线时,获得的能量可以将量化结构激发到更高的能级。激发的类型取决于光线的波长。电子可被紫外光或可见光激发到更高的轨道,红外光可激发分子的振动,微波可激发旋转。吸收光谱是作为波长函数的光线的吸收。原子或分子的光谱取决于其能级结构。吸收光谱可用于鉴定化合物。具体的吸收光谱学方法包括原子吸收光谱法(AA)、红外光谱法(IR)和紫外-可见光光谱法(uv-vis)。

被激发到高能级的原子或分子可以通过发射射线回到低能级。如果是在同一自旋状态之间跃迁,则该光线发射称为荧光;如果跃迁发生在不同的自旋状态之间,则称为磷光。分析物的发射强度在低浓度时与浓度成线性比例,因此可用于对发射物质进行定量。具体的发射光谱学方法包括原子发射光谱法(AES)、原子荧光光谱法(AFS)、分子激光诱导的荧光法(LIF)和X-射线荧光法(XRF)。 当电磁辐射通过物质时,大部分辐射保持其最初的方向,但少部分会沿其它方向散射。以与入射光相同的波长散射的光线称为瑞利散射。在透明固体中由于振动(声子)引起的光线散射称为布里渊散射。布里渊散射通常从入射光位移0.1-1个波数。由于分子中的振动或不透明固体中的声子引起的光线散射称为拉曼散射。拉曼散射可以从入射光线位移多达4000个波数。具体的散射光谱学方法包括拉曼光谱法。

IR光谱法是对样品吸收中红外光线的波长和强度的测量。中红外光(2.5-50μm,4000-200cm)具有足够的能量将分子振动激发到更高能级。IR吸收带的波长对于具体类型的化学键是特征性的,因此IR光谱法通常适用于鉴定有机和有机金属分子。

近红外吸收光谱(NIR)是对样品吸收近红外光线的波长和强度的测量。近红外光的范围从800nm-2.5μm(12,500-4000cm),其能量足以将泛频峰和分子振动组合激发到高的能级。NIR光谱通常用于定量测量有机官能团,特别是O-H、N-H和C=O。NIR仪器的部件和

135

-1

-1

98809047.3说 明 书 第123/205页

设计与uv-vis吸收光谱仪相似。光源通常是钨灯,检测器通常是PbS固体检测器。盛样器可以是玻璃或石英的,常用的溶剂是四氯化碳或二硫化碳。NIR光谱仪方便的仪器设备使其适用于联机检测和过程控制。

紫外和可见光吸收光谱学(uv-vis)是对样品吸收近紫外光和可见光的波长和强度的测量。真空UV的吸收在100-200nm(10-50,000cm);石英UV的吸收在200-350nm(50,000-28,570cm);可见光的吸收在350-800nm(28,750-12,500cm),Beer-Lambert-Bouguet定律描述了该吸收。紫外和可见光的能量足以促进外层电子跃迁到高能级。UV-vis光谱学通常用于溶液中的分子和无机离子或配合物。uv-vis光谱受光谱的宽的特点的。uv测量的光源通常是氢或氘灯,可见光测量的光源是钨灯。这些连续光源的波长用波长分离器如棱镜或光栅单色仪进行选择。通过扫描波长分离器获得光谱并可以从光谱中或在单一波长下进行定量测量。

质谱仪利用离子化原子或分子的质量-电荷比(m/z)的差异将它们分离。因此,质谱法可用于对原子或分子进行定量,并且还可用于确定分子的化学和结构信息。分子具有明显的片段图型,从而可以提供鉴定化合物的结构信息。质谱仪的常规操作如下。产生气态的离子,将离子根据其质量-电荷比在空间或时间上进行分离,然后测定每一质量-电荷比的离子的量。分辨率描述了质谱仪对离子的分离能力,分辨率的定义为R=m/Δm,其中m是离子质量,Δm是质谱中可分辨的两个峰之间的质量差。例如,分辨率为1000的质谱仪可以分辨m/z为100.0的离子和m/z为100.1的离子。

通常,质谱仪(MS)由离子源、质量选择分析仪和离子检测器组成。磁扇形场、四极和飞行时间设计还需要抽取和加速离子以将离子从离子源区域转移到质量分析仪中。以下将讨论多种质量分析仪设计(用于磁扇形场MS、四极MS或飞行时间MS)。磁扇形场MS的单聚焦分析仪采用180、90或60度的粒子束路径。影响粒子的不同的力将不同质量-电荷比的离子分离。对于双聚焦分析仪,在该类型仪

136

-1

-1

-15

98809047.3说 明 书 第124/205页

器中加有静电分析仪来分离具有不同动能的粒子。

四极MS的四极质量过滤器由四个平行排列的金属棒组成。施加的电压影响粒子沿着居于四个棒中间的飞行路线移动的轨道。对于给定的DC和AC电压,仅有一定质量-电荷比的离子可以通过四极过滤器,其它的所有离子均被抛射出其最初的路线。通过监测当棒上的电压改变时通过四极过滤器的离子来获得质谱。

飞行时间质谱仪利用通过“漂移区”的跃迁时间的差异来分离不同质量的离子。它以脉冲的方式进行,从而离子必需以脉冲的方式产生和/或以脉冲的方式释放。脉冲电场将所有离子加速进入到无场的漂移区,离子的动能为qV,其中q是离子电荷,V是施加的电压。由于离子的动能为0.5mV,因此较轻的离子比较重离子有更高的速度,并较快地到达漂移区末端的检测器。离子检测器的输出作为时间的函数展示在示波器土,从而得到质谱。

离子形成过程是质谱分析的起点。化学电离是采用试剂离子与分析物分子(标记)反应,通过质子或负氢转移来形成离子的方法。试剂离子是通过将大大过量(相对于标记而言)的甲烷引入电子碰撞(EI)离子源中产生的。电子碰撞产生CH4和CH3,它们进一步与甲烷反应形成CH5和C2H5。离子化标记的另一种方法是采用等离子体和辉光放电。等离子体是可有效激发并电离原子的部分电离的热气体。辉光放电是保持在两个电极之间的低压等离子体。电子碰撞电离利用电子束(通常是由钨丝产生的电子束)电离气相原子或分子。来自电子束的电子撞掉分析物原子或分子的电子以产生离子。电子喷雾电离利用很细的针和一系列分离器(skimmer)。样品溶液被喷雾到离子源室中以形成小滴。当排出毛细管时小滴携带电荷并且当溶剂蒸发时小滴消失,留下高度带电的分析物分子。ESI特别适用于难以蒸发或电离的生物大分子。快速原子轰击(FAB)利用冲击固体样品的中性原子(通常是Xe或Ar)的高能束以引起解吸和电离。其可用于难以进入气相的生物大分子。FAB很少引起片段化并通常给出大的分子离子峰,使之适用于分子量测定。经加速从离子源通过电荷交

137

+

+

+

+

2

98809047.3说 明 书 第125/205页

换室的离子产生原子束。离子在与中性原子碰撞中吸收电子形成高能原子束。激光电离(LIMS)是一种激光脉冲剥落样品表面的材料并产生可电离某些样品成分的微等离子体的方法。基质辅助的激光解吸电离(MALDI)是蒸发和电离大生物分子如蛋白质或DNA片段的LIMS方法。生物分子被分散于固体基质如烟酸上。UV激光脉冲将携带一些大分子的基质以离子化形式剥落到气相中,以使它们可被提取到质谱仪内。等离子体解吸电离(PD)利用

252

Cf的衰变,产生两个

以相反方向移动的碎片。一个碎片冲击样品激发出1-10个分析物离子。另一个碎片冲击检测器并引发开始采集数据。该电离方法特别适用于大的生物分子。共振电离(RIMS)是其中将一个或多个激光束调至使气相原子和分子共振跃迁的频率,使之以分步方式加速到其离子化电势以上,以产生离子的方法。次级电离(SIMS)利用离子束例如He、O或Ar聚焦在样品表面上并使材料喷溅到气相中。火花源是一种穿过两电极发出电流脉冲以电离固体样品中分析物的方法。

标记在从所连接的分子上裂解之前、期间或之后,可能变成带电的。基于离子“解吸’从固体或液体表面直接形成或发射离子的电离方法,可以应用于非挥发性和热不稳定性化合物。这些方法不要求在电离前使中性分子挥发,并且减少了分子的热降解。这些方法包括场解吸(Becky,场电离和场解吸质谱的原理,Pergamon,Oxford,1977)、等离子体解吸(Sundqvist和Macfarlane,MassSpectrom.Rev.4:421,1985)、激光解吸(Karas和Hillenlunge,分析化学(Anal.Clem.)60:2299,1998;Karas等,Angew.chem.101:805,19)、快速粒子轰击(如快速原子轰击(FAB)和次级离子质谱(SIMS);Barber等,分析化学54:5A,1982)及热喷雾(TS)电离(Vestal,Mass Spectrom.Rev.2:447,1983)。热喷雾广泛应用于与液相色谱联机组合。连续流动FAB方法(Caprioli等,分析化学58:2949,1986)也显示出很大的潜力。更完全的电离/质谱法组合包括:离子捕获质谱法、电喷雾电离质谱法、离子喷雾质

138

3

+

16+

40

+

98809047.3说 明 书 第126/205页

谱法、液体电离质谱法、大气压电离质谱法、电子电离质谱法、亚稳定原子轰击电离质谱法、快原子轰击电离质谱法、MALDI质谱法、光化电离飞行时间质谱法、激光小滴质谱法、MALDI-TOF质谱法、APCI质谱法、纳喷雾质谱法、雾化喷雾电离质谱法、化学电离质谱法、共振电离政谱法、次级离子质谱法、热喷雾质谱法。

这些适合于非挥发性生物化合物的电离方法具有交迭的应用范围。电离效率主要取决于基质组合物和化合物类型。目前可得到的结果表明,TS分子量上限约为8000道尔顿(Jones和Krolik,质谱快讯,1:67,1987)。由于TS主要与四极质谱仪一起使用,所以在较高的质量/电荷比例(m/z)下灵敏度一般都不成比例。飞行时间(TOF)质谱仪可从市场上购得,并具有m/z范围只受检测器效率的优点。最近,已介绍了另外两种电离方法。这两种方法现在称为基质辅助的激光解吸(MALDI,Karas和Hillenkamp,分析化学60:2299,1988;Karas等,Angew.chem.101:805,19)和电喷雾电离(ESI)。这两种方法都有很高的电离效率(即很高的[产生的分子离子]/[消耗的分子]比)。确定技术最终潜力的灵敏度取决于样品大小、离子的量、流速、检测效率及实际电离效率。

电喷雾质谱是建立在最初于60年代提出的理论(Dole等,化学和物理学杂志(J.Chem.Phys.)49:2240,1968)基础上的。电喷雾电离(ESI)是一种产生可用质谱法分析的带电分子的手段。简单地说,电喷雾电离在强静电场中由雾化液体产生高度带电小滴。高度带电的小滴(一般在干浴气体中于大气压下形成)经中性溶剂蒸发而收缩,直到电荷排斥力克服内聚力,导致“库仑爆炸”。电离的准确机制尚有争论,已有几个研究小组提出了假设(Blades等,分析化学63:2109-14,1991;Kebarle等,分析化学65:A972-86,1993;Fenn,J.Am.Soc.Mass.Spectrom.4:524-35,1993)。不管离子形成的基本过程如何,ESI总是于温和条件下从溶液中产生带电荷分子。

用小量有机分子获得有用质谱数据的能力有赖于离子的有效产

139

98809047.3说 明 书 第127/205页

生。ESI的电离效率与分子的正电荷量有关。实验性改善电离作用通常包括使用酸性条件。改善电离的另一种方法是在可能时使用季胺[参见Aebersold等,蛋白科学(Protein Science)1:494-503,1992;Smith等,分析化学60:436-41,1988]。

以下进一步详细描述电喷雾电离。电喷雾离子的产生需要两个步骤:在接近大气压下分散高带电小滴,然后诱导蒸发。使分析物分子的溶液通过保持在高电势下的针。在针的尖端,溶液分散到含分析物分子的带高电荷小滴的气雾中。小滴迅速地蒸发并通过场解吸或残留蒸发的过程,使质子化的蛋白质分子释放到气相中。电喷雾一般是通过对来自毛细管的小的液体流(一般为1-10μL/分钟)施加高电场而产生的。一般在毛细管和位置相距0.2-2cm的反电极之间施加3-6kV的电势差(其中根据去溶剂化的程度,可通过小孔由MS提取电子、带电团、甚至带电小滴样品)。电场导致电荷在毛细管末端的液体表面上积聚;因此液体流速、电阻率和表面张力是小滴形成中的重要因素。高电场导致液体表面的破坏和高带电液体小滴的形成。根据毛细管偏压可产生带正电荷或负电荷的小滴。负离子型需要电子清除剂例如氧的存在以抑制放电。

有多种液体可被静电喷雾到真空中,或者借助喷雾剂喷雾。只使用喷雾电场导致对液体导电率和介电常数的某些应用。室温下以相当于<10M的含水电解质溶液的有用液体流速进行稳定电喷雾需要小于10欧姆的溶液导电率。在对ESI-MS最有用的该模式中,适当的液体流速导致液体分散成细雾。由于离毛细管的距离非常短,小滴直径常常相当均匀并且约为1μm。特别重要的是,对于较高液体流速,总电喷雾离子电流只有轻微增加。有证据表明加热对于操纵电喷雾是有用的。例如,稍微加热可使含水溶液很容易电喷雾,推测是由于降低了粘度和表面张力。热辅助和气体雾化辅助电喷雾允许使用较高的液体流速,但会降低小滴带电的程度。分子离子的形成需要有引起初始小滴群蒸发的条件。为此,可在较高压力下借助于中等温度(<60℃)的干气体流,在通过界面运输期间加

140

-5

-4

98809047.3说 明 书 第128/205页

热,并且(特别是在使用离子俘获法的情况下)在相对低的压力下高能碰撞而实现。

虽然构成ESI之基础的详细过程尚不确定,但经ESI产生的很小的小滴似乎允许溶液中的几乎所有各种带电颗粒在蒸发残留溶剂后被转移到气相中。质谱检测需要离子在去溶剂化后具有可检测的m/z范围(四极装置要求<4000道尔赖),并且能以足够的效率产生和传输。已发现很宽范围的溶剂都适合于ESI-MS,而且电离效率基本上不依赖于分子量,这表明它是一种高度无区别的和广泛适用的电离方法。

电喷雾离子“源”在接近大气压条件下起作用。电喷雾“源’一般是金属或玻璃毛细管,并应用一种使液体溶液相对于反电极电偏离的方法。溶液,典型的是含有分析物并常含有其他添加剂如乙酸的水-甲醇混合物,流向毛细管末端。已描述了一种ESI源(Smith等,分析化学62:885,1990),其可容纳基本上任何溶剂系统。ESI的典型流速为1-10μL/分钟。对ESI-MS界面的基本要求是尽可能有效地从高压区取样并向MS输送离子。

ESI的效率可以很高,从而为可用于本发明的极灵敏装置提供了基础。对于带单电荷的检测对象来说,目前的装置性能可提供在检测器中的总离子电流为约2×10

-12

A或约10计数/秒。在该仪器性能

-10

7

的基础上,如果分析物被完全电离,则浓度低到10M或大约10

-18

mol/秒的单电荷物质将产生可检测的离子流(大约10个计数/秒)。例如,使用带有毛细管区电泳的ESI界面,对季铵离子的检测下限已达到了10

-18

摩尔(Smith等,分析化学,59:1230,1988)。

对于分子量为1000的化合物,其电荷平均数为1,电荷状态近似数为1,峰宽度(m/z)为1,并且最大强度(离子/秒)是1×10。 在获得ESI质谱中实际消耗的样品相当少(Smith等,分析化学60:1948,1988)。使用扇页装置的阵列检测器(其允许同时检测光谱的各部分)也可获得实质性效益。因为目前只能检测由ESI形成的约10的所有离子,所以关注仪器性能的因素可以为改善灵敏

141

-5

12

98809047.3说 明 书 第129/205页

度提供基础。本领域技术人员可以理解到,本发明包括并容纳对电离和检测方法的改进。

界面最好是放在分离装置(例如凝胶)和检测器(例如质谱仪)之间。界面最好有下列特征:(1)能够以不连续的时间间隔收集DNA片段,(2)浓缩DNA片段,(3)从电泳缓冲液和介质中除去DNA片段,(4)从DNA片段上切掉标记,(5)将标记与DNA片段分离开,(6)弃去DNA片段,(7)将标记放在挥发性溶液中,(8)挥发并电离标记,(9)将标记放置或运送到可将标记导入质谱仪的电喷雾装置中。 当DNA片段从凝胶的底部洗脱时,界面也有“收集”DNA片段的能力。凝胶可以包括板凝胶、管状凝胶、毛细管凝胶等。可用几种方法收集DNA片段。第一种方法是使用电场,其中DNA片段被收集到电极上或接近电极处。第二种方法是其中使液体流流过凝胶底部以收集DNA片段。可以接合这两种方法的特征,其中可将DNA收集到流动的液体流中,其后利用电场浓缩。最终结果是从完成分离方法的介质除去DNA片段。这就是说,可以使用电场将DNA片段从一类溶液“拽”到另一类溶液中。

一旦DNA片段处在适当的溶液(与电喷雾和质谱法相容的)中,即可将标记从DNA片段上裂解下来。然后可利用电场将DNA片段(或其残余部分)与标记分离开(该标记最好带有与DNA标记相反的电荷)。然后再利用电场或流动液体将标记导入电喷雾装置内。 优选的检测装置是质谱仪。因为质谱仪可利用离子化物质的质量-电荷比(m/z)的差异特异性地鉴定分子,因此,该检测方法可用于对小分子进行定量,并且还可用于确定分子的化学和结构信息。某些分子具有明显的片段图型,从而可以提供鉴定结构部分的信息。但是,对于本文所述的应用,MSD实质上是以“阵列检测器”的形式用于检测、测定和定量已知分子量的标记。因此,尽管可以使用质谱仪,但科学家目前使用在UV/VIS光谱仪中的二极管阵列检测器来测定具有已知消光系数的小分子。在本文所述的应用中,利用标记来鉴定是否存在特定的核酸序列和图谱样品鉴定。

142

98809047.3说 明 书 第130/205页

四极质谱检测器由四个平行的金属棒组成。两个相对的棒上施加有(U+Vcos(wt))的电势,另外两个棒上施加有-(U+Vcos(wt))的电势,其中的U是dc电压,Vcos(wt)是ac电压。施加的电压影响粒子沿着居于四个棒中间的飞行路线移动的轨道。对于给定的DC和AC电压,仅有一定质量-电荷比的离子可以通过该四极过滤器,其它的所有离子均被抛射出其最初的路线。通过监测当棒上的电压改变时通过四极过滤器的离子来获得质谱。质谱仪对离子的分离能力用分辨率表示,分辨率是质谱仪中可分辨的两个峰之间的质量差。因此,分辨率为1000的质谱仪可以分辨m/z为100.0的离子和m/z为100.1的离子。质谱仪的一般操作是首先产生气相离子,其次,根据离子的质量-电荷比将其在空间或时间上进行分离,第三,测定各质量-电荷比的离子的量。

质谱仪很适于作为用于基因组的光谱仪,因为其可以同时测定成百上千的标记。目前用于基因组应用(测序、作图、基因定型)的标记的数目大约是4,这是由于荧光标记的发射图谱(300nm-700nm)的重叠造成的。相反,采用目前的四极仪器(例如Micromass MS,Hewlett Packard LC/MSD 1100,PE Sciex API 165 LC/MS或FinniganNavigator),可以在50-3000amu的光谱内放置约400个标记。MS仪至少具有0.1amu的分辨率。通过轻微改动,我们所描述的新的测量系统(即标记的生物分子)可以和几乎所有的市售质谱仪和HPLC系统联用。优选在“驱动”软件中带有软件包以用于分子生物学、基因或基因组应用中。适宜的软件包记载于,例如1997年7月22日递交的美国临时专利申请60/053,429中。

大气压化学电离(APCI)可用于多种标记类型,并且通常用于提高分子离子的丰度(在APCI过程中,分子很少形成结合物)。APCI的可用分子量范围通常是50-3000amu。在低分辨能力的情况下,质量测定的精确度是0.1amu,在高分辨率模式中为5ppm。APCI使用试剂离子与分析物分子反应,通过质子或负氢转移形成离子。目前,由APCI所形成的离子中,仅有约10到10被检测到。该重要的参

143

-4

-5

98809047.3说 明 书 第131/205页

数(该参数了仪器的性能)可以作为改善灵敏度的基础。该电离方法是一种连续的方法,适于用作HPLC或毛细管电泳的界面。 还有其它可用于CMST技术的电离形式。电喷雾电离(ESI)可以从溶液中的样品直接产生分子离子。电喷雾电离是可与单一四极仪器兼容的一种方法。在获得ESI质谱时仅消耗非常少的样品(Smith等,分析化学,60:1948,1988),但将离子引入到MS真空系统中的总效率仍相对较低。ESI还受变性剂和去污剂的影响,这些物质会对电离步骤产生不利影响。该方法还可用于小分子量和大分子量的生物聚合物(肽、蛋白质、糖和DNA片段)以及类脂。与脉冲形式的MALDI不同,ESI是连续的电离方法。采用ESI作为电离方法,通常产生多电荷的离子(分子更易形成加合物)。

另一种电离方法是基质辅助的激光解吸电离(MALDI),该方法可用于测定本文所描述的标记(肽、蛋白质、寡核苷酸和来源于生物的其它化合物以及小的合成聚合物)的分子量。所需的样品量非常少(pmol或更少)。该分析可以线性模式(高质量,低分辨率斤m/z最高分子量为300,000(很少数的情况下))或反射模式进行(低质量,高分辨率,最高分子量为10,000)。

APCI和ESI通常被认为是MALDI的补充。MALDI的严重缺点是它是一种无法定量的电离方法。电喷雾电离已被安装在HP四极、Finnigan LCQ、Finnigan TSQ 7000(Medicine)、PE/Sciex仪和Micromass仪上。APCI和ESI相对于MALDI的优点是能够在任何分离方法(即HPLC和电泳)中进行实时测量。

荧光标记可以通过其吸收和荧光发射波长和强度直接进行鉴定和定量。

尽管常规的分光荧光计的适用范围非常大,能够提供连续的激发和发射波长(lex、lS1、lS2)范围,但专用仪器如流式细胞计数器和激光扫描显微镜需要可以在单一固定波长激发的探针。在现代的仪器中,通常是氩激光的488nm线。

每一探针分子的荧光强度与e和QY的乘积成比例。对于目前常

144

98809047.3说 明 书 第132/205页

-1-1

用的荧光团,这些参数的范围是,ε约为10,000至100,000cmM,QY为0.1-1.0。当高强度的照射使吸收趋向饱和时,激发的荧光团的不可逆破坏(光漂白)成为荧光检测能力的因素。光漂白的实际影响取决于所用的荧光检测技术。

本领域技术人员可以理解,在分离和检测步骤之间可以插入一个装置(界面),以使大小分离和标记检测可以(实时)连续进行。这使得分离方法和仪器与检测方法和仪器统一形成单一的装置。例如,在分离技术和质谱检测或恒电势电流分析法之间插入界面。 界面的功能主要是从分析物上释放(例如质谱)标记。有几种代表性的界面装置。界面的设计取决于可裂解接头的选择。对于光可裂解接头,需要能量或光源。对于酸不稳定性接头、碱不稳定性接头或二硫化物接头,需要在界面中加入试剂。对于热不稳定性接头,需要热源。对于酶敏感性接头如特异性蛋白酶和肽接头,核酸酶和DNA或RNA接头、糖基化酶、HRP或磷酸酯酶以及在裂解后不稳定的接头(与化学发光底物类似),需要加入酶。界面的其它特点包括,最低的谱带增宽、在注射到质谱仪之前将DNA与标记分离。分离技术包括基于电泳方法和技术、亲和技术、大小截留(透析)、过滤等的方法。

还可以通过捕获电泳浓缩标记(或核酸-接头-标记构建体),然后释放到另一种与选定的特定类型电离方法兼容的试剂流中。界面还可以将标记(或核酸-接头-标记构建体)捕获在微珠上,将小珠射到室中然后进行激光解析/汽化。还可以流式提取到另一种缓冲液中(例如,通过渗透膜从毛细管电泳缓冲液提取到疏水性缓冲液中)。在某些应用中,还需要将标记间歇地传送到质谱仪中,这可能包括界面的另外的功能。界面的另一个功能是将标记从多个柱送入质谱仪中,每个柱都有一转动时槽。另外,有可能将标记从单个柱传送到按时间分开的多个质谱检测器中,每组标记收集数毫秒,然后送入质谱仪。

下面列出的是可用于本发明的分离和检测技术设备的代表性销

145

98809047.3说 明 书 第133/205页

售商。Hoefer Scientific Instruments(San Francisco,CA)生产用于测序的电泳装置(Two Step,Poker FaceII)。PharmaciaBiotech(Piscataway,NJ)生产用于DNA分离和测序的电泳装置(PhastSystem用于PCR-SSCP分析,MacroPhor System用于DNA测序)。Perkin Elmer/Applied Biosystems Division(ABI,FosterCity,CA)生产基于荧光素染料的半自动测序仪(ABI373和ABI377)。Analytical Spectral Devices(Boulder,CO)生产UV分光光度计。Hitachi Instruments(日本东京)生产原子吸收光谱仪、荧光光谱仪、LC和GC质谱仪、NMR光谱仪及UV-VIS光谱仪。PerSeptive Biosystems(Framingham,MA)生产质谱仪(Voyager

TM

TM

TM

Elite)。Bruker Instruments Inc.(Manning Park,MA)生产FTIR光谱仪(Vector22)、FF拉曼光谱仪、飞行时间质谱仪(Reflex II)离子俘获质谱仪(Esquire)和Maldi质谱仪。Analytical

Technology Inc.(ATI,Boston,MA)制造毛细管凝胶电泳装置、UV检测器和二极管阵列检测器。Teledyne Electronic

Technologies(Mountain View,CA)制造离子俘获质谱仪(3DQDicovery和3DQ Apogee)。Perkin Elmer/Applied BiosystemsDivision(Foster City,CA)制造可与电喷雾匹配的Sciex质谱仪(三联四极LC/MS/MS,API 100/300)。Hewlett-Packard(Santa Clara,CA)生产质量选择性检测器(HP5972A)、MALDI-TOF质谱仪(HP G2025A)二极管阵列检测器、CE装置、HPLC装置(HP1090)及UV光谱仪。Finnigan Corporation(San Jose,CA)制造质谱仪(磁扇形场(MAT95S)、四极光谱仪(MAT 95SQ)和四种其他的相关质谱仪)。Rainin(Emevyville,CA)制造HPLC装置。

本文描述的方法和组合使得可以使用裂解的标记作为样品类型和核酸鉴定的图谱。在每个测序方法开始时,为每个特定的(选择的)引物指定一个特殊的独特标记。标记指示样品类型、双脱氧终止子类型(就Sanger测序反应而言)或优选两者。具体地说,标记指示引物类型,引物类型又指示载体类型,载体类型又指示样品身份。通

146

TM

TM

TM

TMTM

TM

98809047.3说 明 书 第134/205页

过参照其中放置有标记引物的双脱氧核苷酸反应,标记也可能指示双脱氧终止子类型(ddTTP、ddCTP、ddGTP、ddATP)。然后进行测序反应并及时按大小依次分离所得到的片段。

在时间框架中从片段上切下标记并在时间框架内检测和记录之.将标记图谱与时间框架相比较以构成序列.即,在按大小分离之后及时记录所有的标记,并且在数据框架中变成相互关联的。按大小分离步骤可分离开以一个核苷酸递增的核酸片段,因此以一个核苷酸的增量分离了相关的标记。由于预知双脱氧终止子或核苷酸图谱和样品类型,所以很容易以线性方式推断出序列。

本发明的基因指纹系统通常由样品导入装置、分离所研究标记样品的装置、将可变量的样品分到馏份收集器中的分流装置、将标记从所研究的样品上裂解的装置、检测标记的装置、分析所收集的数据并将其以差示模式显示的软件程序。本领域技术人员可以理解,当持有本公开说明书时,该一般性描述可以在所列的各部分有多种变化。参照图15,举例性的本发明的基因指纹系统10由样品导入装置12、通过高效液相色谱(HPLC)分离样品的分离装置14、分流装置13、馏份收集器15、将标记从所研究的样品上裂解的光裂解装置16、通过电化学检测器检测标记的检测装置18、分析检测装置所得到结果的带有数据分析软件程序的数据处理装置20。以下将更详细地讨论各部分。

样品导入装置12自动取样测定基因指纹方法产生的PCR产物的等分试样22并将其通过常规的管24传送到分离装置14(通常是HPLC)中。举例性实施方案的样品导入装置12由温控的自动取样器26组成,该自动取样器可适用于微滴定板。自动取样器26是温控的,以保持所产生的核酸样品的完整性,并能够注射25μl或更少量的样品。该类型样品导入装置12的生产商是例如Gilson(Middleton,WI)。

该样品导入装置通过常规管24与分离装置14有效相连。分离装置14中接受到的测定等分试样22中的PCR产物通过高效液相色

147

98809047.3说 明 书 第135/205页

谱分离得到分离的DNA片段。高效液相色谱可以带有恒溶剂、二元溶剂或四元溶剂泵27,并且可以从多家生产商购买到(例如HewlettPackard(Palo Alto,CA)HP1100或1090系列,Beckman InstrumentInc.(800-742-2345),Bioanalytical Systems,Inc.(800-845-4246),ESA,Inc.(508)250-700),Perkin-Elmer Corp.(800-762-4000),Varian Instruments(800-926-3000),WatersCorp.(800-254-4752))。

分离装置14包括适用于分离寡核苷酸的HPLC分析柱28。柱28是分析HPLC,例如,改性的无孔聚苯乙烯二乙烯基苯(2.2μm粒度)固相载体,可以在2-12的pH范围内,高达3000psi的压力下和10-70℃的温度范围内使用。温控装置(例如柱烤箱)(未示出)可用于控制柱的温度。该温控装置是本领域已知的,并可以从例如RaininInstruments(Varian Instrument,Palo Alto,CA的子公司)购得。适宜的柱28可以以商品名DNAsep

从Serasep(San Jose,CA)得

到。其它适宜的HPLC分析柱可从其它生产商(例如Hewlett

Packard(Palo Alto,CA)、Beckman Industries(Brea,CA)、WatersCorp.(Milford,MA)和Supelco(Bellefonte,PA))得到。

在举例性的实施方案中,分离装置14中加入了样品分流器13,样品分流器13与流动的样品流相连。样品分流器13可以以常规方式将可变量的样品分流到馏份收集器15中以进行进一步的分析或进行保存。馏份收集器15必需能够适应小的体积、具有到低温的温控、并且具有可调节的取样时间。同轴分流器的生产商包括Upchurch(Oak Harbor,WA)。

馏份分离器15与HPLC/LC装置通过流体分流线29相连。馏份收集器15可以将特定的峰、DNA、RNA和核酸片段或所研究分子收集到管、微滴定板的孔中或容器中。此外,馏份收集器15还可以收集通过HPLC或LC分离的一组核酸片段的全部或一部分。馏份收集器的生产商包括Gilson(Middleton,WI)和Isco(Lincoln,NE)。在该方法中使用馏份收集器15比基于凝胶的系统具有明显的优点。例

148

98809047.3说 明 书 第136/205页

如,可以直接克隆通过HPLC或LC方法回收的核酸片段。此外,还可以通过PCR方法扩增由HPLC或LC方法回收的核酸片段。这两种方法使得可以在序列水平迅速鉴定所研究的核酸片段。当与基于凝胶的系统联用时,两种方法均敏琐并且低效率。

在举例性的实施方案中,馏份收集器15是基因指纹系统10中的部分。在另一个实施方案中(未示出),馏份收集器15插入到了样品导入装置12中。因此,流体分流线32使分流的样品从样品分流器13返回到样品导入装置12中。

分离DNA片段流(例如测序反应产物)通过常规的管30从样品分流器13下游的分离装置14流到裂解装置16中。每一DNA片段均标有独特的可裂解(例如可被光裂解的)标记。分离DNA片段的流体通过裂解装置16并在该装置中脱除标记用于检测(例如通过质谱检测或使用电化学检测器)。在该举例性的实施方案中,裂解装置16是光裂解单元,从而样品流暴露于选定的光能量和波长下。在一个实施方案中,样品进入光裂解装置16并与选定的光源接触选定的一段时间。在另一个实施方案中,样品流沿着能够接触足够的光能量以将标记从分离DNA片段上裂解的路线接近光源运输。

光裂解装置可以从Supelco(Bellefonte,PA)购得。光裂解可以用汞/氙弧光灯在多波长下进行。波长精度约为2nm,频带宽度10nm。照射区域是圆形的,面积通常为10-100cm。在另一些实施方案中,可以使用其它能够通过酸、碱、氧化、还原、氟化物、硫醇交换、光解或酶条件裂解的裂解装置来除去分离的DNA片段上的标记。

在裂解装置16从分离的DNA片段上裂解掉标记后,标记通过常规管32流到检测装置18中进行对各标记的检测。标记的检测可以基于标记PCR步骤中所产生的各种DNA所用的各标记之间的电化学电势差。电化学检测器18可以以电量或电流原理进行。优选的机电检测器18是电量检测器,其由流通式或多孔碳-石墨电流检测器组成,其中的柱洗出物通过电极导致100%的检测效率。为了完全检测

149

2

98809047.3说 明 书 第137/205页

各成分,使用带有16个电量检测器的阵列,其中,每一电量检测器处于不同的电势(通常的增量为60mV)。该类型检测器的生产商的例子是ESA(Bedford,MA)和Bioanalytical Systems Inc.(800-845-4246)。

在图16举例说明的另一个实施方案中,样品导入装置12、分离装置14和裂解装置16按照以上的讨论依次连接以保持样品的流动。裂解装置16与检测装置18相连,所述检测装置是质谱仪40或类似的仪器,它根据标记PCR步骤中所产生的各种DNA所用的各标记之间的分子量的差异检测标记。基于质量差异的最佳检测器是质谱仪。为此,质谱仪40通常具有带有电喷雾或化学电离的大气压电离(API)界面、四极质量分析仪,并且质量范围至少为50-2600m/z。适宜质谱仪的生产商的例子是:Hewlett Packard(Palo Alto,CA)HP 1100LC/MSD、Hitachi Instruments(San Jose,CA)M-1200HLC/MS,Perkin-Elmer Corporation,Applied BiosystemsDivision(Foster City,CA)API 100 LC/MS或API 300LC/MS/MS、Finnigan Corporation(San Jose,CA)LCQ,MAT 95 S、BrukerAnalytical Systems,Inc.(Billerica,MA)APEX,BioAPEX和ESQUIRE和Micromass(U.K.)。

检测装置18与从检测装置接受数据的数据处理器和分析器20电学连接。数据处理器和分析器20包括可以鉴定所检测标记的软件程序。在另一些实施方案中,处理器和分析器230与注射装置12、分离装置14、馏份收集器15和/或裂解装置16有效连接以控制基因指纹系统10中的不同部分。

软件包绘出特异性引物的给定标记的电化学识别标志和保留时间。然后对软件生成的核酸图进行比较(长度对长度,片段对片段)并将结果报告给使用者。软件将突出核酸片段图中的相似性和差异。软件还可以指导馏份收集器15收集特定的核酸片段。 软件包绘出特异性引物的给定标记的m/z识别标志和保留时间。然后对软件生成的核酸图进行比较(长度对长度,片段对片段)

150

98809047.3说 明 书 第138/205页

并将结果报告给使用者。软件将突出核酸片段图中的相似性和差异。软件还可以指导馏份收集器收集特定的核酸片段。

本发明的系统18用于系统多个部分的有效相互连接。因此,一个或多个系统部分,例如在一个实验室中运行的样品导入装置12和检测装置18可以和系统的其它部分(例如分离装置14、裂解装置16以及数据处理器和分析器20)联合,以在实验室中装备本发明的DNA测序系统10。

本发明的另一实施方案提供了示差显示系统,该系统一般由下列部分组成:样品导入装置、分离所研究的标记样品的装置、将不同量样品分到馏分收集器的分解装置、从所研究的样品裂解标记的元件、用于检测标记的装置和用于分析所收集的数据并以示差显示模式显示的软件程序。在拥有本发明公开内容的情况下,本发明的一般性描述的所列各组分有许多改变,这对于本领域技术人员是显而易见的。本发明举证性实施方案的示差显示系统由与图15所列类似的部分,包括样品导入装置12,通过高效液相层析(HPLC)分离样品的分离装置14,分流装置13,馏分收集器15,用于从所研究的样品裂解标记的光裂解装置16,用于通过电化学方法检测标记的检测装置18,以及带有软件程序的数据处理器和分析器20。下面详细说明各组分。

在示差显示系统中,样品导入装置12自动取出示差显示过程中产生的PCR产物测量量等份22并将其通过常规管24传递到分离装置14(通常是HPLC)。举证性实施方案的样品导入装置12由适用于微滴定板的温控自动取样器26组成。自动取样器26必须是温控的以保持所产生的核酸样品的完整性并能够注射25μL或更少的样品。这种产品制造商以例如Gilson(Middleton,WI)为代表。 样品导入装置通过常规管24依次与分离装置有效连接。分离装置14接收的测量量PCR产物22随时间通过高效液相层析分离以提供分离的DNA片段。高效液相层析可以有恒溶剂、二元或四元溶剂泵27,并可从许多制造商(例如Hewlett Packard(Palo Alto,CA)HP

151

98809047.3说 明 书 第139/205页

1100或1090系列,Analytical Technology Inc.(Madison,WI),Perkin Elmer,Waters等)处购买。分离装置14包括适用于分离寡核苷酸的HPLC分析柱28。柱28是一种分析HPLC,例如改性的无孔聚苯乙烯二乙烯苯(颗粒大小为2.2μm)固相载体,其可在pH2-12,高达3000psi的压力,10-70℃的温度下操作。可以使用温控装置(例如柱烤箱)(未列出)以控制柱的温度。所述温控装置是本领域已知的并可从例如Rainin Instruments(Varian Instrument,Palo Alto,CA的子公司)得到。适宜的柱28可以商品名DNAsep

从Serasep(San

Jose,CA)得到。其他适宜的分析HPLC柱可从其他制造商(例如

Hewlett Packard(Palo Alto,CA),Beckman Industries(Brea,CA),Waters Corp.(Milford,MA)和Supelco(Bellefonte,PA))处得到。

在所列的实施方案中,馏分收集器15是与系统的其他组分相连的示差显示系统10中一个组分。在另一实施方案中,将馏分收集器15并入样品导入装置12。因此,分流进样线32将来自样品分流器13的倒流样品导回至样品导入装置12。

在所列实施方案中的分离装置14并入与样品流连接的样品分流器13。调整样品分流器13以便用常规方法将不同量的样品转移至馏分收集器15进行进一步分析或贮存。馏分收集器15必须能够容纳少量体积,有至低温的温控并具有可调整的取样时间。管线分流器的制造商包括Upchurch(Oak Harbor,WA)。

分离的DNA片段流通过常规管30由样品分流器113下游分离装置14流入裂解装置16。将每种PCR产物用特有的可裂解(如可光裂解)标记标记。分离的DNA片段流通过裂解装置16,在裂解装置16内除去标记以便用电化学检测方法检测。在举证性的实施方案中,所述裂解装置16是光裂解装置以便样品流与选定的光能接触。在一个实施方案中,样品进入光裂解装置16并与选定的光源接触一段选定的时间。在另一实施方案中,样品流被放在邻近光源的适宜管中或类似装置中,沿着可充分暴露于光源的路径,从而从分离的DNA

152

98809047.3说 明 书 第140/205页

片段中裂解所述标记。

光裂解装置可从Supelco(Bellefonte,PA)得到。用汞/氙弧光灯,可在多个波长下完成光裂解。波长的精确度为约2nm,带宽度为10nm。照射区域为圆形并且通常面积为10-100平方厘米。在另一实施方案中,可使用通过酸、碱、氧化、还原、氟化物、硫醇交换、光解或酶促条件裂解的其他裂解装置以便从分离的DNA片段中除去标记。

在裂解装置16从分离的DNA片段中裂解了标记后,标记流过常规管32进入检测装置18中以进行各标记的检测。标记的检测是基于用于标记PCR产生的各种DNA的各标记之间在电化学能方面的差异。电化学检测器18可根据电量或电流检测原理操作。优选的电机械检测器18是电量检测器,它是由直通式或多孔碳石墨电流检测器组成,其中柱洗脱液流过电极,得到100%的检测效率。为了完全检测各组分,可使用以不同电压(通过以60mV增加)操作的16电量检测器阵列。该类检测器的制造商包括ESA(Bedford,MA)和Bioanalytical Systems Inc.(800-845-4246)。

在图16所列的另一示差显示系统的实施方案中,为了保持样品的流通,将样品导入装置12、分离装置14和裂解装置16依次按上述连接。裂解装置16与检测装置18相连,该装置可基于用于标记PCR产生的各种DNA的各标记之间分子量方面的差异检测标记。以质量差异为基础的最佳检测器是质谱仪40。对于这种用途,质谱仪通常带有有电喷或化学电离的大气压电离(API)界面、四极质量分析仪,质量范围为至少50-2600m/z。适宜质谱仪的制造商有:HewlettPackard(Palo Alto,CA)HP1100 LC/MSD,Hitachi Instrments(SanJose,CA),M-1200H LC/MS,JEOL USA,Inc.(Peabody,MA),PerkinElmer Corporation,Applied Biosystems Division(Foster City,CA)API 100 LC/MS或API 300 LC/MS/MS,Finnigan

Corporation(San Jose,CA)LCQ,MAT 95S,MAT 95 S Q,MAT 900S,MAT 900 S Q和SSQ 7000,Bruker Analytical Systems,

153

98809047.3说 明 书 第141/205页

Inc.(Billerica,MA)APEX,BioAPEX和ESQUIRE。

检测装置18与从检测装置接收数据的数据处理器和分析器20电学相连。数据处理器和分析器20包括鉴定被检测标记和其在DNA序列中的位置的软件程序。在另一实施方案中,数据处理器和分析器20与注射装置12、分离装置14、馏分收集器15和/或裂解装置16有效相连以便控制示差显示系统的不同组分。

软件包将给定标记的特征反映到特异引物上和保留时间。然后将软件产生的核酸图进行比较(长度对长度,片段对片段)并将结果报告给使用者。软件将突出核酸片段图中的相似性和差异。软件还能够指导通过馏分收集器15收集特定核酸片段。

软件包将给定标记的m/z特征反映到特异性引物和保留时间。然后将软件产生的核酸图进行比较(长度对长度,片段对片段)并将结果报告给使用者。软件将突出核酸片段图中的相似性和差异。所述软件还能够指导通过馏分收集器收集特定核酸片段。

示差显示系统由有效地相互连接的系统多个组分提供。因此,可将在实验室使用的一种或多种系统组分如样品导入装置12和检测装置18与该系统的其他组分,如分离装置14,裂解装置16和数据处理器和分析器20组合以给实验室提供本发明的DNA测序系统。 本发明的单核苷酸延伸检测、寡核苷酸连接检测或基于寡核苷酸探针的检测系统一般由样品导入装置、用于分离所研究的标记样品的装置、从所研究的样品中裂解所述标记的装置、用于检测标记的装置和分析所收集的数据的软件程序组成。在拥有本发明公开内容的情况下,本发明一般性描述的所列各组分可以有许多改变,这对于本领域技术人员是显而易见的。如图17中所清楚显示的,(需要附图#),优选的单核苷酸延伸检测、寡核苷酸连接检测或基于寡核苷酸探针的检测系统200由样品导入装置212,通过高效液相层析(HPLC)分离样品的分离装置214,用于从所研究的样品裂解标记的光裂解装置216,用于通过质谱法检测标记的检测装置218,以及带有软件程序的数据处理器和分析器220。下面详细说明各组分。

154

98809047.3说 明 书 第142/205页

样品导入装置212自动取出用各种方法(PCR、连接、消化、核酸酶等)产生的核酸片段的测量液222并将其通过常规管224传递到分离装置214(通常是HPLC)。举证性实施方案的样品导入装置212由适合于微滴定板的温控自动取样器226组成。自动取样器226必须是温控性的以保持所产生的核酸样品的完整性并能够注射25μL或更少的样品。这种产品制造商以例如Gilson(Middleton,WI)为代表。

样品导入装置依次通过常规管224与分离装置有效连接。分离装置214接收的核酸产物(可通过PCR、连接反应、消化、核酸酶等方法产生)等份222通过高效液相层析时间性地分离。高效液相层析可以有恒溶剂的、二元的或四元泵227,并可从许多制造商(例如Hewlett Packard(Palo Alto,CA)HP 1100或1090系列,BeckmanInstruments Inc(800-742-2345),Bioanalytical Systems,Inc.(800-845-4246),ESA,Inc.(508)250-700,Perkin Elmer Corp.(800-762-4000),Varian Instruments(800-926-3000),WatersCorp.(800-254-4000)等)处购买。

分离装置214包括适用于分离核酸片段的分析HPLC柱228。柱228是一种分析HPLC,例如改性的无孔聚苯乙烯二乙烯苯(颗粒大小为2.2μm)固相载体,可在pH2-12,高达3000psi的压力,10-70℃的温度范围内操作。可以使用温控装置(例如柱烤箱)(未列出)以控制柱的温度。所述温控装置是本领域已知的并可从例如RaininInstruments(Varian Instrument,Palo Alto,CA的子公司)得到。适宜的柱228可以商品名DNAsep

从Serasep(San Jose,CA)得到。

由于不需要分辨单个碱基对,所以可使用各种HPLC柱228作为该具体技术装置。其他适宜的分析HPLC柱可从其他制造商(例如HewlettPackard(Palo Alto,CA),Beckman Industries(Brea,CA),WatersCorp.(Milford,MA))处得到。

分离DNA片段(例如测序反应产物)流通过常规管230由分离装置214流入裂解装置216。每个PCR产物标记了特有的可裂解(如光

155

98809047.3说 明 书 第143/205页

可裂解)标记。分离DNA片段流通过裂解装置216,在裂解装置216内除去标记以便用质谱法或电化学检测器检测。光裂解装置可从Supelco(Bellefonte,PA)得到。可用汞/氙弧光灯在多个波长下完成光裂解。波长的精确度为约2nm,带宽度为10nm。照射区域为圆形面积通常为10-100平方厘米。在另一些实施方案中,可使用通过酸、碱、氧化、还原、氟化物、硫醇交换、光解或酶促条件裂解的其他裂解装置以便从分离的DNA片段中除去标记。

在裂解装置216从分离的DNA片段中裂解了标记后,标记流过常规管232流入检测装置218进行各标记的检测。标记的检测可以基于用于标记分析步骤中产生的各种DNA的各标记之间在分子量方面的差异。基于质量差异的最好的检测器是质谱仪。对于这种用途,质谱仪通常带有有电喷或化学电离的大气压电离(API)界面、四极质量分析仪,质量范围为至少50-2600m/z。适宜质谱仪的制造商有:Hewlett Packard(Palo Alto,CA)HP1100 LC/MSD,HitachiInstrments(San Jose,CA),M-1200H LC/MS,Perkin ElmerCorporation,Applied Biosystems Division(Foster City,CA)API 100 LC/MS或API 300 LC/MS/MS,Finnigan Corporation(SanJose,CA)LCQ,Bruker Analytical Systems,Inc.(Billerica,MA)、ESQUIRE和Micromers(U.K.)。

在图18所列的另一实施方案中,为了保持样品的流通,将样品导入装置212、分离装置214和裂解装置216依次按上述连接。裂解装置216与检测装置218相连,它是一种电化学检测器240,可基于用于标记测序反应步骤中产生的各种DNA的各标记之间在电化学能方面的差异检测标记。该举例性实施方案中的电化学检测器可以依电量或电流原理运行。优选的电化学检测器240是电量检测器,它是由直通式或多孔碳石墨电流检测器组成,在电流检测器中,柱洗脱液流过电极,得到100%的检测效率。为了完全检测各组分,可利用加以不同电压(通过以60mV增加)的16电量检测器阵列。该类检测器的制造商包括ESA(Bedford,MA)和Bioanalytical Systems

156

98809047.3说 明 书 第144/205页

Inc.(800-845-4246)。电化学检测器的其他制造商可在下文所列的其他制造商名单中找到。

电化学检测器240与带有上述软件包的数据处理器和分析器220电学相连。软件包将给定标记的检测特性(如质量或电化学特征)反映到特异性样品ID上。所述软件能够鉴定所研究的核酸片段并可将ID信息存入相应的数据库。

本文所述的DNA分析系统比传统凝胶为基础的系统有许多优越性。一个主要的优越性是这些系统可完全自动化。通过利用HPLC为基础的分离系统,可将样品自动注射到HPLC中,而凝胶为基础的系统需要手工操作。还显著节约了准备实验时间(不需要清洗凝胶板,无凝胶灌注)和分析时间(大量凝胶分析需要4小时以上,而HPLC分析只需5分钟至1小时)。另外,还有样品处理量大的优点。利用本发明所述的标记,一批可分析许多样品(可达384份样品/道),而凝胶为基础的分析仅为4种荧光团或一个样品/道。所用的凝胶本身很软而且很容易破裂或者含有气泡或其他缺陷,从而使整个凝胶或数个道不能用。HPLC柱是粗糙的,而且当购买预装好的柱时,没有填装缺陷,要得到一致的、一般来说均匀的分离道。HPLC还有更高的质量保证性,即由于HPLC柱的重现性,可以使用内部标准。而凝胶之间以及凝胶内部的凝胶质量不一致,这使得利用标准物几乎不可能。最后,质谱和电化学检测器都比以凝胶为基础的系统中所用的更灵敏,从而对少量样品的检测和分析的更少,可用于非PCR分析。

阵列检测中的标记探针

已经用带有共价连接寡核苷酸的阵列完成通过杂交的DNA序列分析(Southern等,Genomics13:1008,1992;Drmanac等,科学260:19,1993),确定表达图、筛选突变等。总之,用于这些检测方法的检测使用荧光或放射性标记。通过其吸收值和荧光发射波长和强度可最直接地鉴定并定量分析荧光标记。利用荧光光源的显微

157

98809047.3说 明 书 第145/205页

镜/摄影装置是检测荧光标记的简便方法。通过标准放射自显影、磷光体图象分析或CCD检测器可观察放射性标记。对于所述标记,单位时间内可检测的不同反应数受到。例如,使用如在DNA序列分析中常用的四荧光分子限于同时分析4个样品。实质上,由于这种,当使用这些检测方法时,必须单独评估每个反应。 一种更优越的检测方法可以将至少一个阵列中的样品反应物集中起来并同时检测产物。利用一种标记,如本文所述的那些(在每个反应中有不同分子量或其他物理属性),可将整组反应产物收集在一起并进行分析。

如上所述,本文所述方法可用于各种目的。例如,可将寡核苷酸阵列用于控制制备阵列的质量、用于定量或定性分析核酸分子、用于检测突变、用于确定表达分布图、用于毒理检测等。 1.探针定量检测或定型分析

在该实施方案中,将寡核苷酸固定在阵列的每个元件中,其中,元件中的每种寡核苷酸是不同序列或是相关序列。优选地,每个元件拥有已知的或相关的一套序列。标记探针上这种阵列的杂交可以表征探针并鉴定或定量分析探针群中所含的序列。

在下文讨论的特定应用中可以使用的普遍检测方式是夹心检测方式。在该方式中,将多种已知序列的寡核苷酸固定在固体底物上。用该固定的寡核苷酸捕获核酸(例如RNA、rRNA、PCR产物、DNA片段),然后将信号探针与被捕获的靶核酸的不同部分杂交。 另一种普遍的检测方式是二级检测系统。在该方式中,用阵列鉴定并定量分析一级结合检测中所用的标记核酸。例如,如果检测产生一种标记的核酸,则可通过与一阵列杂交鉴定该核酸。当与可裂解质谱标记结合时,这些检测方式特别有用。 2.突变检测

用扫描技术(适用于鉴定以前未知的突变)或者设计用来检测、

158

98809047.3说 明 书 第146/205页

辨别或定量分析已知序列变体的技术,可以鉴定样品中与单核苷酸有关的突变。基于衍生于野生型和突变序列的错配互补DNA链的异源双链表现出异常迁移行为的观察结果,已发展了数种可用于突变检测的扫描技术。

本文所述的方法可用于突变筛选。检测DNA链中突变的一种策略是将待测序列与野生型或突变序列的靶序列杂交。错配的序列对短寡核苷酸探针与靶序列的杂交有去稳定的作用(参见,Wetmur,Crit.Rev.Biochem.Mol.Biol.,26:227,1991)。待测核酸源可以是基因组DNA、RNA、cDNA或任何这些核酸的扩增产物。优选,首先完成待测序列的扩增,然后将所述待测序列与固定在阵列中的短寡核苷酸探针杂交。通过确定扩增产物与固定化寡核苷酸探针阵列的杂交图,可对扩增产物进行扫描以确定许多可能的序列变体。 通常通过利用标记的核苷酸或利用标记的引物,将如本文所述的标记掺入到最终的扩增产物中。将扩增产物变性,然后与阵列杂交。洗掉未结合的产物,用本文所述的任一种方法检测与阵列结合的标记。例如,当使用可裂解质谱标记时,可同时检测多个产物。 3.表达分布图/示差显示

哺乳动物,例如人,在其基因组中约有100,000个不同的基因,其中,每个细胞内仅少部分,可能15%得到表达。示差显示技术可以鉴定特异于各种细胞类型的基因。简而言之,在示差显示中,将mRNA的3’末端部分扩增并以大小为基础进行鉴定。用设计用来与poly(A)尾5’边界结合的引物进行反转录,随后利用上游的任意序列引物扩增cDNA,可以得到mRNA亚群。

如本文所公开的,提供了用于测量大量基因(例如1-2000)表达的高处理量方法。在本发明的一个实施方案中,提供了用于分析所选生物样品的基因表达图的方法,该方法包括下列步骤:(a)用一种或多种标记引物扩增生物样品的cDNA,其中所述标记与特定的核酸探针有关,并可通过非荧光光谱法或电势测定法检测,(b)按本文所

159

98809047.3说 明 书 第147/205页

述,将扩增片段与寡核苷酸阵列杂交,(c)洗掉未杂交的物质,和(d)用非荧光光谱法或电势测定法检测标记,由此确定生物样品的基因表达图。固体底物以标记为基础的示差显示,特别是利用可裂解质谱标记的示差显示,可以表征表达上不同的基因。 4.单核苷酸延伸检测

可将引物延伸技术用于检测核酸模板中的单核苷酸改变(Sokolov,核酸研究,18:3671,19)。该技术通常可用于检测任何单碱基突变(Kuppuswamy等,Proc.Natl.Acad.Sci.USA,88:1143-1147,1991)。简而言之,该方法首先将引物与邻近已知单核苷酸多态现象的序列杂交。然后使引发的DNA处于下述条件下:其中,如果模板中的下一个碱基与反应混合物中的标记核苷酸互补,则DNA聚合酶将加上一个标记的dNTP,通常是ddNTP。在一种变通方法中,首先扩增cDNA中在两个等位基因间含有单碱基差异的所研究序列。然后,通过将处于多态位点5’侧1个碱基的引物退火并用一种标记碱基(通常是一种双脱氧核苷酸)延伸,来分析每种扩增产物中是否存在每种等位基因或等位基因的相对量。只有当在反应中有正确的碱基时,才能在引物的3’末端掺入碱基。然后,通过与寡核苷酸阵列杂交(未延伸的产物将不杂交),分析延伸产物。 简而言之,在本发明中,将每种双脱氧核苷酸用一种特有的标记标记。四种反应混合物中,只有一种会在引物序列上加入双脱氧终止子。如果存在突变,在与阵列杂交后,通过检测双脱氧核苷酸上的标记可检测所述突变。通过用特有的标记标记DNA引物,可同时确定多个突变。因此,DNA片段在各包含一种不同的标记双脱氧终止子的四种不同反应物中反应,其中,所述标记与特定的双脱氧核苷酸有关并可用非荧光光谱法或电势测定法检测。将DNA片段与阵列杂交,然后将未杂交的物质洗掉。从杂交片段中裂解所述标记,然后用相应的检测技术(例如质谱法、红外光谱法、恒电势电流滴定法或UV/可见光光谱法)检测。检测的所述标记与研究的特定DNA片

160

98809047.3说 明 书 第148/205页

段以及突变核苷酸的身份有关。 5.寡核苷酸连接检测

寡核苷酸连接检测(OLA)(Landegren等,科学241:487,1988)可用于鉴定很大和很复杂的基因组中的已知序列。OLA反应的原理是连接酶共价连接相邻地杂交于给定DNA靶上的两个诊断寡核苷酸的能力。如果在探针连接部位的序列,碱基对不完全匹配,连接酶将不能连接所述探针。在使用标记时,可将所述标记与连接扩增产物的探针相连。完成OLA后,将片段与互补序列的阵列杂交,然后裂解标记并用质谱法检测。

在本发明的一个实施方案中,提供了利用寡核苷酸连接检测方法鉴定核酸分子或者检测例如生物样品中的选定核酸分子的方法。简而言之,所述方法主要包括下列步骤:在靶DNA上完成PCR,然后与5’标记的报告DNA探针和5’磷酸化探针杂交。将样品与T4 DNA连接酶一起保温。将带有连接探针的DNA链通过与阵列杂交而捕获在阵列上(其中未连接的产物不能杂交上)。从分离的片段中裂解标记,然后通过相应的检测技术(例如质谱法、红外光谱法、恒电势电流滴定法或UV/可见光谱法)检测所述标记。 6.其他检测方法

本文所述的方法还可用于病毒或微生物的基因定型或鉴定。例如F+RNA大肠杆菌噬菌体作为肠病毒污染指标是有用的候选物。除血清定型外,利用核酸扩增和杂交法的基因定型是一种可靠、快速、简单省钱的方法(Kafatos等,核酸研究7:1541,1979)。已将扩增技术和核酸杂交技术成功地用于对各种微生物进行分类,包括大肠杆菌(Feng,Mol.Cell Probes 7:151,1993),轮状病毒(Sethabutr等,J.Med.Virol.37:192,1992)、丙型肝炎病毒(Stuyver等,J.Gen.Virol.74:1093,1993)、单纯性疱疹病毒(Matsumoto等,J.Virol.Methods 40:119,1992)。

161

98809047.3说 明 书 第149/205页

已描述了各种哺乳动物和人肿瘤中的遗传改变,这种遗传改变代表了在致癌中观察到的形态改变的形态学基础(Vogelstein等,NEJM 319:525,1988)。近几年,随着分子生物学技术的发展,已主要研究了特定染色体上的等位基因丢失或者肿瘤抑制基因的突变以及数种癌基因(例如c-myc,c-jun和ras家族)中的突变。以前的工作(Finkelstein等,Arch.Surg.128:526,1993)已鉴定了K-ras癌基因中的特定类型点突变与结肠癌诊断阶段之间的关系。结果表明,突变分析可以提供肿瘤攻击性,包括转移方式和扩散的重要信息。在结肠癌III阶段中,TP53和K-ras-2突变分析的预后价值最近得到进一步证实(Pricolo等,Am.J.Surg.171:41,1996)。因此,显然肿瘤和前癌细胞的基因定型和特定突变检测将在人类的癌症治疗中变得越来越重要。阵列检测中的标记探针

可将本文公开的标记生物分子用于探查生物分子的(未标记)阵列。优选的生物分子阵列含有具表面的固体基底,其中用聚(乙烯亚胺)(PEI)至少覆盖部分所述表面。所述PEI层含有由连续的第二区毗邻并包围的多个不连续第一区。所述第一区由存在生物分子和PEI确定,而第二区由PEI的存在和基本上不存在生物分子来确定。优选,基底是剥离板或硅片。但是,基度可以是例如石英、金、尼龙6,6,尼龙或聚苯乙烯以及其组合物。

PEI涂层优选含有分子量为100-100,000的PEI。PEI涂层可以用例如甲硅烷化PEI与基底直接连接。或者,可将双功能交联剂的反应产物放在基底表面和PEI涂层之间,其中反应产物与所述表面和PEI涂层共价结合,并确保PEI涂层与所述表面结合。双功能交联剂含有第一和第二活泼官能团,其中所述第一活泼官能团例如是三(O-C1-C5烷基)硅烷,而第二活泼官能团例如是环氧化物、异氰酸酯、异硫氰酸酯和酐基团。优选的双功能交联剂包括2-(3,4-环氧环己基)乙基三甲氧基硅烷;3,4-环氧丁基三甲氧基硅烷;3-异氰酸

162

98809047.3说 明 书 第150/205页

丙基三乙氧基硅烷,3-(三乙氧基甲硅烷基)-2-甲基丙基琥珀酸酐和3-(2,3-环氧丙氧基)丙基三甲氧基硅烷。

本发明的阵列包括含生物分子的第一区,其中每个区都有约1000平方微米至约100000平方微米的面积。在优选的实施方案中,所述第一区有从约5000平方微米至约25000平方微米的面积。 优选所述第一区基本上是圆形,其中圆的平均直径为约10微米至约200微米。无论是否圆形,优选所述第一区之间的边界通过至少约25微米,但不超过约1厘米(且优选不超过约1000微米)的平均距离分开。在优选的排列中,相邻第一区的边界由约25微米至100微米的平均距离分开,其中优选在整个阵列中,该距离保持恒定,而且优选第一区位于如附图所示的重复几何图形内。在优选的重复几何图形中,所有相邻的第一区均由几乎相同的距离(约25微米至约100微米)分开。

在优选的阵列中,底物上有10-50个第一区。在另一实施方案中,底物上有50-400个第一区。在另一优选的实施方案中,底物上有400-800个第一区。

位于第一区内的生物分子优选是核酸聚合物。优选的核酸聚合物是含有约15-约50个核苷酸的寡核苷酸。生物分子可以是含有约50-约1000个核苷酸的扩增反应产物。

在每个第一区中,生物分子优选以10-10个生物分子/2000平方微米第一区的平均浓度存在。更优选生物分子的平均浓度为10-10个生物分子/2000平方微米。在第二区中,生物分子优选以低于10个生物分子/2000平方微米第二区的平均浓度存在。更优选以低于102个生物分子/2000平方微米的平均浓度存在。第二区最好不含任何生物分子。

用于将PEI层粘附到底物上的化学方法主要取决于基底的化学性质。现有技术提供了可将PEI粘附到固相载体上的多例适宜化学方法。例如,当底物是尼龙-6,6时,可通过Van Ness,J.等,核酸研究19:3345-3350,1991和PCT国际公开WO 94/00600(这两篇文献

163

39

7

5

9

98809047.3说 明 书 第151/205页

均引入本文作为参考)中公开的方法施用PEI涂层。当固相载体是玻璃或硅时,应用PEI层的适宜方法见例如Wasserman,B.P.Biotechnology and Bioengineering XXII:271-287,1980;和D’Souza,S.F.Biotechnology Letters 8:3-8,1986。 优选PEI涂层与固体基底共价相连。当固体基底是玻璃或硅时,可用甲硅烷化化学方法,将PEI涂层与底物共价相连。例如带有活泼甲硅烷氧基端基的PEI可从Gelest,Inc.(Tullytown,PA)购买到。可将所述活泼PEI与玻璃片或硅片接触,缓慢搅动后,PEI将粘附于基底上。或者,可使用双功能甲硅烷基化试剂。按照该方法,将玻璃或硅底物用双功能甲硅烷基化试剂处理以提供带有活泼表面的底物。然后将PEI与活泼表面接触,通过双功能试剂与所述表面共价结合。

放在阵列中的生物分子以所谓“排列溶液”而存在。为了将生物分子放在PEI涂覆的底物上的不连续区中,排列溶液优选含有浓度为总组合物体积约35vol%至约80vol%的增稠剂,浓度为0.001μg/ml至10μg/ml的优选为寡核苷酸的生物分子,和水。 液体增稠剂如甘油增稠剂的浓度是35%V/V至80%V/V。增稠剂在组合物中的优选浓度在某种程度上取决于进行排列所需的温度。排列温度越低,所用增稠剂的浓度就越低。温度与液体增稠剂浓度对照的组合使得可以在大部分固相载体(例如玻璃、薄片、尼龙6/6,尼龙膜等)上制备阵列。

增稠剂的存在使得低浓度的各种其他物质可以与生物分子一起同时存在。例如在排列溶液中可含有0.001%V/V至1%V/V的洗涤剂。由于PCR缓冲液含有少量吐温-20或NP-40,而且经常需要直接排列PCR小瓶的样品核酸,而不需预先纯化扩增子,因此,含有洗涤剂是有用的。增稠剂的使用可以使盐(例如氯化钠、氯化钾或氯化镁)、缓冲液(例如Tris)和/或螯合剂(例如EDTA)也可存在于排列溶液中。增稠剂的使用还有其它优点,使得还可以在排列溶液中使用交联剂和/或有机溶剂。由于商业上可得到,通常可将交联剂溶解在有

1

98809047.3说 明 书 第152/205页

机溶剂如DMSO、DMF、NMP、甲醇、乙醇等中。使用增稠剂时,在排列溶液中可用浓度为0.05%-20%(V/V)的常用有机溶液。

一般来说,增稠剂使排列溶液的粘度增加。当排列溶液中达到适宜的粘度时,第一滴基本上与例如沉积的第100滴的大小相同。当在排列溶液中使用不适当的粘度时,沉积的第一滴比后来沉积的明显更大。理想的粘度是处于纯水与纯甘油之间的粘度。

阵列中的生物分子可以是核酸聚合物或其类似物如PNA,硫代磷酸酯和甲基膦酸酯。核酸指核糖核酸和脱氧核糖核酸。生物分子可含有非天然和/或合成碱基。生物分子可以是单链或双链核酸聚合物。

优选的生物分子是核酸聚合物,包括寡核苷酸(高达约100个核苷酸碱基)和多核苷酸(约100个碱基以上)。优选的核酸聚合物由15-50个核苷酸碱基形成。另一优选的核酸聚合物含有50-1000个核苷酸碱基。核酸聚合物可以是PCR产物、PCR引物或核酸双螺旋,仅举数例。但是,如下所述,当核酸含有伯胺时,基本上任何核酸均可与PEI涂覆的表面共价相连。核酸聚合物在排列溶液中的典型浓度为0.001-10μg/ml,优选0.01-1μg/ml,最佳为0.05-0.5μg/ml。

优选的核酸聚合物是“胺改性的”,即已将其进行改性以使其在核酸聚合物的5’末端含有伯胺,优选在伯胺与核酸聚合物的核酸部分之间置入一个或多个亚甲基(-CH2-)。6是亚甲基的优选数目。胺改性的核酸聚合物是优选的,因为它们可通过5’-胺基与固相载体共价结合。用5’-己胺改性的PCR引物可排列PCR产物。在用氨基烯丙基-dUTP(Sigma,St.Louis,MO)通过缺刻翻译而导入胺后可排列核酸双螺旋。用氨基烯丙基-dUTP通过聚合酶如末端转移酶,或通过连接酶将含胺的短核酸聚合物连接到核酸上,可将胺导入到核酸中。

优选在与PEI涂层接触前将核酸聚合物激活。这可通过将胺功能化的核酸聚合物与多功能胺活性化合物如三氯三嗪混合很方便地

165

98809047.3说 明 书 第153/205页

完成。当核酸聚合物含有5’-胺基时,5’-胺可与三氯三嗪(氰尿酰氯)反应(Van Ness等,核酸研究19(2):3345-3350,1991)。优选将过量的氰尿酰氯加至核酸聚合物溶液中,其中优选氰尿酰氯摩尔数比排列溶液中核酸聚合物内的胺数过量10-至1000-倍。用这种方法,大部分以胺为尾的核酸聚合物与一分子三氯三嗪反应,以致核酸聚合物变成由二氯三嗪为尾。

优选用常规缓冲液如磷酸钠、硼酸钠、碳酸钠或Tris HCl缓冲排列溶液。排列溶液的优选pH为7-9,优选的缓冲液是pH8.3-8.5的新鲜制备的硼酸钠。为了制备典型的排列溶液,将己基胺改性的核酸聚合物以0.1μg/mL放在0.2M硼酸钠,pH8.3中,达到50μl的总体积。然后加入10μl 15mg/ml氰尿酰氯溶液,25℃搅拌下将反应进行1小时。加入甘油(Gibco Brl的终浓度。

可用微装配中目前大量使用的任何技术,将生物分子排列溶液加到PEI涂层上。例如,可将溶液放在喷墨印刷头中,从所述头部喷向涂层。

将生物分子溶液传递到PEI涂层上的优选方法使用改良过的弹簧(spring)探针。弹簧探针可从数个销售商处获得,包括EverettCharles(Pomona,CA),Interconnect Devices Inc.(Kansas City,Kansas)和Test Connections Inc.(Upland,CA)。为了使上述市售的弹簧探针可作为本发明的液体贮存装置,必须从探针尖上除去1/1000-5/1000英寸的金属材料,产生垂直于弹簧探针纵轴的平表面。优选从所述尖的底部除去约1/1000-5/1000英寸的金属材料,这可以用很细的有细纹的湿石头很容易完成。市售的并经改良后可提供上述平尖的具体弹簧探针包括由Ostby Barton(EverettCharles(Pomona,CA)的一个部门)制造的XP54探针;由EverettCharles(Pomona,CA)制造的SPA25P探针和来自Test ConnectionsInc.(Upland,CA)的43-P有凹槽弹簧探针。

可将上述排列溶液直接用于排列过程中。即不需在印刷步骤

166

,Grand Island,NY)至56%

98809047.3说 明 书 第154/205页

前,从未反应的氰尿酰氯中纯化出激活的核酸聚合物。通常,将激活的核酸粘附于固相载体的反应可在20-50℃进行1-20小时。优选反应时间是在25℃1小时。

本文所述的阵列特别适用于进行例如利用CMST标记探针的杂交检测。但是,为了完成所述检测,在杂交步骤前必须将固相载体上的胺加帽。这可通过将固相载体与0.1-2.0M琥珀酸酐反应来实现。优选的反应条件是在70%m-pyrol中的1.0M琥珀酸酐和0.1M硼酸钠。通常使反应在25℃进行15分钟至4小时,优选反应时间为30分钟。用3x水洗涤除去残留琥珀酸酐。

然后将固相载体与含0.1-5M甘油的0.1-10.0M硼酸钠(pH7-9)溶液一起保温。该步骤可给任何二氯三嗪加帽,二氯三嗪通过转变成单氯三嗪而与PEI表面共价结合。优选的条件是在0.1M硼酸钠(pH8.3)中的0.2M甘油。然后用含洗涤剂的溶液洗涤固相载体以除去未结合的物质如痕量NMP。优选,将固相载体在0.01M NaCl,0.05M EDTA和0.1M Tris pH8.0中加热至95℃,5分钟。该加热步骤除去未共价连接的核酸聚合物,如PCR产物。在排列双链核酸的情况下,该步骤还具有将双链转变成单链形式的作用(变性)。 可用探针(如寡核苷酸、核酸片段、PCR产物等)探查阵列,所述探针可能标记了例如本文所述的CMST、放射性同位素、荧光团或生物素标记。生物素化核酸的方法是本领域熟知的,而且由

Pierce(Avidin-Biotin Chemistry:A Handbook,Pierce ChemicalCompany,1992,Rockford Illinois)作了充分的描述。通常在包括GuSCN,GuHCl,甲酰胺等的标准杂交溶液(参见Van Ness and Chen,核酸研究19:5143-5151,1991)中,以0.1ng/mL-10μg/ml使用探针。

为了检测杂交事件(即生物素的存在),将固相载体与链霉抗生物素/辣根过氧化物酶结合物一起保温。所述酶结合物可从例如Vector Laboratories(Burlingham,CA)购买。链霉抗生物素以高亲和性与生物素分子结合,将辣根过氧化物酶携带至杂交探针附

167

98809047.3说 明 书 第155/205页

近。在简单的洗涤步骤中,可洗掉未结合的链霉抗生物素/辣根过氧化物酶结合物。然后,在存在过氧化物和适宜缓冲液的条件下,利用沉淀底物检测辣根过氧化物酶的存在。

与对比色底物预期的检测水平相比,沉积于反射性表面如薄片上的蓝色酶产物具有低许多倍的检测水平(LLD)。此外,对于不同的着色酶产物,LLD有很大的不同。例如4-甲氧基萘酚(产生沉淀的蓝色产物)的LLD为约1000个分子/50μM直径点,而红色沉淀底物的LLD为1,000,000个分子/50μM直径点,高约1000倍。用配有可见光光源和CCD照相机(Princeton Instruments,Princeton,NJ)的显微镜(如可从Zeiss购买到的Axiotech显微镜)探查表面来确定LLD。一次可扫描约10,000μM×10,000μM的图象。

为了使用蓝色比色检测方案,在酶促反应后,表面必须非常干净,而且必须在干燥状态下扫描薄片或玻片。另外,必须在参照点饱和前停止酶促反应。对于辣根过氧化物酶,是约2-5分钟。 对于碱性磷酸酶或辣根过氧化物酶(HRP),还可以使用化学发光底物,或者对于HRP或碱性磷酸酶,可使用荧光底物。实例包括可从Perkin Elmer得到的用于碱性磷酸酶的dioxetane底物或者来自JBL Scientific(San Luis Obispo,CA)的Attophos HRP底物。 下列实施例是按举例说明方式,而不是以的方式提供的。 除另外指出者外,用于实施例中的化学品均可从AldrichChemical Company,Milwaukee,WI得到。本文使用具有所指出的含义的下列缩写:

ANP=3-(Fmoc-氨基)-3-(2-硝基苯基)丙酸 NBA=4-(Fmoc-氨基甲基)-3-硝基苯甲酸

HATU=O-7-氮杂苯并-1-基-N,N,N’,N’-四甲基脲六氟磷酸盐

DIEA=二异丙基乙胺 MCT=一氯三嗪 NMM=4-甲基吗啉

168

98809047.3说 明 书 第156/205页

NMP=N-甲基吡咯烷酮

ACT357=ACT357肽合成仪,购自Advanced ChemTech,Inc.Louisville,KY

ACT=Advanced ChemTech,Inc.,Louisvile,KY

NovaBiochem=CalBiochem-NovaBiochem International,SanDiego,CA

TFA=三氟乙酸 Tfa=三氟乙酰基 iNIP=N-甲基4-哌啶酸 Tfp=四氟苯基

DIAEA=2-(二异丙基氨基)乙胺 MCT=一氯三嗪

5’-AH-ODN=5’-氨基己基结尾的寡脱氧核苷酸

实施例

                      实施例1

用于可裂解-MW-鉴定剂测序中的酸不稳定性接头的制备

A.可化学裂解的质谱标记五氟苯基酯的合成,以释放带羧酰胺未端的标记

图1显示了反应流程。

步骤A.在ACT357肽合成仪(ACT)的收集容器中用DMF悬浮

TentaGel S AC树脂(化合物II;得自ACT;1当量)。加入溶于DMF的化合物I(3当量)、HATU(3当量)和DIEA(7.5当量)并将收集容器振荡1小时。除去溶剂并用NMP(2次)、MeOH(2次)和DMF(2次)洗树脂。重复I与树脂偶联以及洗涤的步骤,得到化合物III。步骤B.将树脂(化合物III)与25%哌啶的DMF溶液混合并振荡5分钟。将树脂过滤,然后与25%哌啶的DMF溶液混合并振荡10分钟。除去溶剂,用NMP(2次)、MeOH(2次)和DMF(2次)洗涤树脂,然后

169

98809047.3说 明 书 第157/205页

直接用于步骤C。

步骤C.将步骤B的脱保护的树脂悬浮于DMF中并向其中加入FMOC保护的、在其侧链中含有胺官能团的氨基酸(化合物IV,如α-N-FMOC-3-(3-吡啶基)-丙氨酸,可购自Synthetech,Albany,OR;3当量)、HATU(3当量)和DIEA(7.5当量)的DMF溶液。将容器振荡1小时。除去溶剂并用NMP(2次)、MeOH(2次)和DMF(2次)洗涤树脂。重复IV与树脂偶联以及洗涤的步骤,以得到化合物V。步骤D.按步骤B中的描述用哌啶处理树脂(化合物V)以除去FMOC基团。然后用ACT357将收集容器中的脱保护树脂等分到16个反应容器中。

步骤E.将得自步骤D的16等份脱保护树脂悬浮于DMF中。向各反应容器中加入溶于DMF的适宜羧酸VI1-16(R1-16CO2H;3当量)、HATU(3当量)和DIEA(7.5当量)。将容器振荡1小时。除去溶剂并用NMP(2次)、MeOH(2次)和DMF(2次)洗涤各等份的树脂。重复VI1-16与各等份树脂偶联以及洗涤的步骤,得到化合物VII1-16。

步骤F.用CH2Cl2(3次)洗涤各等份的树脂(化合物VII1-16)。向各反应容器中加入1%TFA的二氯甲烷溶液并将容器振荡30分钟。将溶剂从反应容器过滤到各个管中。用二氯甲烷(2次)和MeOH(2次)洗涤各等份的树脂并将滤液合并到各个管中。真空蒸发各个管,得到化合物VIII1-16。

步骤G.将每种游离羧酸VIII1-16溶解于DMF中。向各溶液中加入吡啶(1.05当量),然后再加入三氟乙酸五氟苯酯(1.1当量)。室温下将混合物搅拌45分钟。用EtOAc稀释溶液,用1M柠檬酸水溶液(3次)和5%NaHCO3水溶液(3次)洗涤,用硫酸钠干燥,过滤并真空蒸发,得到化合物IX1-16。

B.可化学裂解的质谱标记五氟苯基酯的合成,以释放带羧酸末端的标记

因2显示了反应流程。

170

98809047.3说 明 书 第158/205页

步骤A.将4-(羟甲基)苯氧基丁酸(化合物I;1当量)与DIEA(2.1当量)和烯丙基溴(2.1当量)在氯仿中混合并加热回流2小时。用EtOAc稀释混合物,用1N HCl(2次)、pH9.5碳酸盐缓冲液(2次)和盐水(1次)洗涤,用硫酸钠干燥,并真空蒸发得到化合物I的烯丙酯。

步骤B.将步骤A制得的化合物I的烯丙酯(1.75当量)与FMOC保护的、在其侧链中含有胺官能团的氨基酸(化合物II,如α-N-FMOC-3-(3-吡啶基)-丙氨酸,可购自Synthetech,Albany,OR;1当量)、N-甲基吗啉(25当量)和HATU(1.1当量)在二氯甲烷中混合并室温搅拌4小时。用二氯甲烷稀释混合物,用1M柠檬酸水溶液(2次)、水(1次)和5%NaHCO3水溶液(2次)洗,用硫酸钠干燥并真空蒸发。将化合物III通过快速色谱(二氯甲烷→EtOAc)分离。

步骤C.将化合物III溶于二氯甲烷中,加入Pd(PPh3)4(0.07当量)和N-甲基苯胺(2当量)并将混合物室温搅拌4小时。用二氯甲烷稀释混合物,用1M柠檬酸水溶液(2次)和水(1次)洗,用硫酸钠干燥并真空蒸发。经快速色谱(二氯甲烷→EtOAc+HOAc)分离化合物IV。步骤D.在ACT357肽合成仪(Advanced ChemTech Inc.(ACT),Louisville,KY)的收集容器内用DMF悬浮TentaGel S AC树脂(化合物V;1当量),加入溶于DMF中的化合物IV(3当量)、HATU(3当量)和DIEA(7.5当量)并将收集容器振荡1小时。除去溶剂并用NMP(2次)、MeOH(2次)和DMF(2次)洗涤树脂。重复IV与树脂偶联以及洗涤的步骤,得到化合物VI。

步骤E.将树脂(化合物VI)与25%哌啶的DMF溶液混合并振荡5分钟。过滤树脂,然后与25%哌啶的DMF溶液混合并振荡10分钟。除去溶剂并用NMP(2次)、MeOH(2次)和DMF(2次)洗树脂。然后用ACT357将脱保护的树脂从收集容器中等分到16个反应容器中。步骤F.将步骤E的16等份脱保护树脂悬浮于DMF中。向各反应容器内加入溶于DMF的适宜羧酸VII1-16(R1-16CO2H;3当量)、HATU(3当量)和DIEA(7.5当量)。将容器振荡1小时。除去溶剂并用NMP(2

171

98809047.3说 明 书 第159/205页

次)、MeOH(2次)和DMF(2次)洗涤各等份的树脂。重复VII1-16与各等份树脂偶联以及洗涤的步骤,得到化合物VIII1-16。

步骤G.用CH2Cl2(3次)洗涤各等份的树脂(化合物VIII1-16)。向各反应容器中加入1%TFA的二氯甲烷溶液并将容器振荡30分钟。将溶剂从反应容器过滤到各个管中。用二氯甲烷(2次)和MeOH(2次)洗涤各等份的树脂并将滤液合并到各个管中。真空蒸发各个管,得到化合物IX1-16。

步骤H.将每种游离羧酸IX1-16溶解于DMF中。向各溶液中加入吡啶(1.05当量),然后再加入三氟乙酸五氟苯酯(1.1当量)。室温下将混合物搅拌45分钟。用EtOAc稀释溶液,用1M柠檬酸水溶液(3次)和5%NaHCO3水溶液(3次)洗涤,用硫酸钠干燥,过滤并真空蒸发,得到化合物X1-16。

                     实施例2                 T-L-X光裂解的演示

室温下用近紫外光照射实施倒11中制备的T-L-X化合物7分钟。使用在350mm处有发射峰的Rayonett荧光紫外灯(Southern NewEngland Ultraviolet Co.,Middletown,CT)作为紫外光源。将灯放在距离含样品平皿15cm处。SDS凝胶电泳显示在这些条件下85%以上的结合物被裂解。

                   实施例3

制备荧光标记的引物和演示荧光团的裂解寡核苷酸的合成和纯化

使用制造商提供的标准亚磷酰胺化学法或H-膦酸酯化学法(Glenn Research Sterling,VA)在自动DNA合成仪上制备寡核苷酸(ODN)。适当封闭的dA、dG、dC和T亚磷酰胺是以这些形式从市场上购得的,并且可很容易地将合成的核苷转化成这种适当的形式。

172

98809047.3说 明 书 第160/205页

使用由制造商提供的标准亚磷酰胺,或H-膦酸酯化学法制备寡核苷酸。使用标准方法的改变形式纯化寡核苷酸。使用12微米、300#Rainin(Emeryville,CA)Dynamax C-8 4.2×250mm反相柱对带有5’-三苯甲基的寡核苷酸进行HPLC色谱,用15%至55%MeCN的0.1NEt3NHOAc(pH7.0)溶液梯度洗脱20分钟。当完成脱三苯甲基化时,进一步用凝胶排阻色谱法纯化寡核苷酸。用PRP柱(Alltech,Deerfield,IL)在碱性pH条件下通过PAGE法分析检查寡核苷酸的质量。

2,4,6-三氯三嗪衍生的寡核苷酸的制备:使10至1000μg 5’-末端胺连接的寡核苷酸与过量重结晶过的氰尿酰氯在溶于碱性(最好pH8.3-8.5)缓冲液的10%N-甲基吡咯烷酮中于19℃至25℃下反应30至120分钟。终反应混合物由0.15M硼酸钠(pH8.3)、2mg/ml重结晶的氰尿酰氯和500μg/ml各寡核苷酸组成。在G50

Sephadex(Pharmacia,Piscataway,NJ)柱上经排阻色谱除去未反应的氰尿酰氯。

然后使活化的纯化寡核苷酸在室温下于0.15M硼酸钠(pH8.3)中与100倍摩尔过量的胱胺反应1小时。在G50 Sephadex柱上经大小排阻色谱除去未反应的胱胺。然后使衍生的ODN与胺反应性荧光染料反应。将所得到的ODN制备物分成3份,每份各与(a)20倍摩尔过量的德克萨斯红磺酰氯(Molecular Probes,Eugene,OR)、(b)20倍摩尔过量丽斯胺磺酰氯(Molecular Probes,Eugene,OR)或(c)20倍摩尔过量的荧光素异硫氰酸酯反应。终反应条件是在0.15M硼酸钠(pH8.3)中于室温下反应1小时。在G50 Sephadex柱上经大小排阻色谱除去未反应的荧光染料。

为了从寡核苷酸上裂解荧光染料,将ODN调整到1×10摩尔,然后在TE(TE是0.01M Tris,pH7.0,5mM EDTA)中稀释(12,3倍稀释)。向100μl体积的ODN中加入25μl 0.01M二硫苏糖醇(DTT)。一组相同的对照物中不加DDT。将混合物室温下保温15分钟。在黑色微滴定板中检测荧光。从保温管中取出溶液(150μl)并放在黑色微滴

173

-5

+

-

98809047.3说 明 书 第161/205页

定板(Dyantek Laboratories,Chantilly,VA)中。使用FluoroskanII荧光计(Flow Laboratories,McLean,VA)直接读平板,其中使用495nm激发波长并监测520nm发射波来检测荧光素,使用591nm激发波长并监测612nm的发射波以检测德克萨斯红,使用570nm激发波长并监测590nm发射波以检测丽丝胺,结果如表1所示。 表1

荧光团摩尔数1.0×10M3.3×10M1.1×10M3.7×10M1.2×10M4.1×10M1.4×10M4.5×10M

98777665

未裂解的RFU6.42.40.90.30.120.140.130.12

裂解的RFU12004511354415.34.92.50.8

游离的RFU13454561304816.05.12.80.9

数据表明,当荧光团从ODN上裂解下来时,相对荧光约增加200倍。

                    实施例4

制备标记的M13序列引物并演示标记的裂解

制备2,4,6-三氯三嗪衍生的寡核苷酸:使1000μg 5’-末端胺连接的寡核苷酸(5’-己胺-TGTAAAACGACGGCCAGT-3″)(Seq.ID No.1)与重结晶过的过量氰尿酰氯在溶于碱性(最好pH8.3-8.5)缓冲液的10%N-甲基吡咯烷酮中于19℃至25℃下反应30至120分钟。终反应混合物由0.15M硼酸钠(pH8.3)、2mg/ml重结晶的氰尿酰氯和500μg/ml各寡核苷酸组成。在G50 Sephadex柱上经大小排阻色谱除去未反应的氰尿酰氯。

然后使活化的纯化寡核苷酸在室温下于0.15M硼酸钠(pH8.3)中与100倍摩尔过量的胱胺反应1小时。在G50 Sephadex柱上经大小

174

98809047.3说 明 书 第162/205页

排阻色谱除去未反应的胱胺。然后使衍生的ODN与各种酰胺反应。将所得到的ODN制备物分成12份,每份各与(25摩尔过量)下列酸的五氟苯酯反应:(1)4-甲氧基苯甲酸,(2)4-氟苯甲酸,(3)甲苯甲酸,(4)苯甲酸,(5)吲哚-3-乙酸,(6)2,6-二氟苯甲酸,(7)烟酸N-氧化物,(8)2-硝基苯甲酸,(9)5-乙酰水杨酸,(10)4-乙氧基苯甲酸,(11)肉桂酸,(12)3-氨基烟酸。反应在0.2M硼酸钠(pH8.3)中于37℃进行2小时。在G50 Sephadex柱上经凝胶排阻色谱纯化衍生的ODN。

为了从寡核苷酸上裂解掉标记,将ODN调整到1×10摩尔,然后在TE(TE是0.01M Tris,pH7.0,5mM EDTA)中用50%EtOH(V/V)稀释(12,3倍稀释)。向100μl体积的ODN中加入25μl 0.01M二硫苏糖醇(DTT)。一组相同的对照物中不加DDT。室温下保温30分钟。然后加NaCl至0.1M并加入2体积EtOH以沉淀ODN。以14000g于4℃下离心15分钟以除去溶液中的ODN。保留上清液,彻底干燥。然后将沉积物溶解于25μl MeOH中。然后以质谱法检测沉积物中标记的存在。

用于本研究的质谱仪是外部离子源傅里叶变换质谱仪(FTMS)。将为了MALDI分析所制备的样品沉积到直接探针的尖端并插入到离子源中。当用激光脉冲照射样品时,离子从该源中被抽提出来并通入长的四极离子导槽中,由此将它们聚焦并输送到位于超导磁铁中心孔内的FTMS分析仪小室中。

光谱产生如下信息。在下列分子量处,峰的强度从25到100相对强度单位发生变化:(1)指示4-甲氧基苯甲酸衍生物的

212.1amu,(2)指示4-氟苯甲酸衍生物的200.1amu,(3)指示甲苯甲酸衍生物的196.1amu,(4)指示苯甲酸衍生物的182.1amu,(5)指示吲哚-3-乙酸衍生物的235.2amu,(6)指示2,6-二氟苯甲酸衍生物的218.1amu,(7)指示烟酸N-氧化物衍生物的199.1amu,(8)指示2-硝基苯甲酰胺的227.1amu,(9)指示5-乙酰水杨酸衍生物的179.18amu,(10)指示4-乙氧基苯甲酸衍生物的226.1amu,(11)指

175

-5

98809047.3说 明 书 第163/205页

示肉桂酸衍生物的209.1amu,(12)指示3-氨基烟酸衍生物的198.1amu。

结果表明MW-鉴定剂从引物上被裂解下来并可用质谱法检测。                     实施例5

一组式R1-36-LYS(ε-iNIP)-ANP-Tfp化合物的制备

图3举例说明平行合成一组36个T-L-X化合物(X=Lh),其中Lh是活化的酯(具体说是四氟苯基酯),L是邻硝基苄基胺基团,L是连接Lh和L的亚甲基基团,T具有其中赖氨酸的羧酸基团已连接到L

2

2

2

3

苄胺基团氮原子上形成酰胺键的模块结构,且分子量可变部分R1-36(其中这些R基团相当于如本文定义的T,并可通过本文所列出的任何一种特定的羧酸被导入)通过赖氨酸的α-氨基基团连接,而质谱灵敏度增强基团(通过N-甲基4-哌啶酸导入的)通过赖氨酸的ε-氨基基团连接。 参见图3:

步骤A.在ACT357的收集容器中用DMF悬浮NovaSyn HMP树脂(可从NovaBiochem得到;1当量)。加入溶于DMF的化合物I(从ACT得到的ANP;3当量)、HATU(3当量)和NMM(7.5当量)并将收集容器振荡1小时。除去溶剂并用NMP(2次)、MeOH(2次)和DMF(2次)洗树脂。重复I与树脂偶联以及洗涤的步骤,得到化合物II。步骤B.将树脂(化合物II)与25%哌啶的DMF溶液混合并振荡5分钟。将树脂过滤,然后与25%哌啶的DMF溶液混合并振荡10分钟。除去溶剂,用NMP(2次)、MeOH(2次)和DMF(2次)洗涤树脂,然后直接用于步骤C。

步骤C.将步骤B的脱保护的树脂悬浮于DMF中并向其中加入FMOC保护的、在其侧链中含有受保护胺官能团的氨基酸(Fmoc-赖氨酸(Aloc)-OH,购自PerSeptive Biosystems;3当量)、HATU(3当量)和NMM(7.5当量)的DMF溶液。将容器振荡1小时。除去溶剂并用NMP(2次)、MeOH(2次)和DMF(2次)洗涤树脂。重复Fmoc-176

2

98809047.3说 明 书 第1/205页

Lys(Aloc)-OH与树脂偶联以及洗涤的步骤,得到化合物IV。步骤D.用二氯甲烷(2次)洗树脂(化合物IV),然后悬浮在(PPh3)4Pd(O)(0.3当量)和PhSiH3(10当量)的二氯甲烷溶液中。将混合物振荡1小时。除去溶剂并用二氯甲烷(2次)洗树脂。重复钯处理步骤。除去溶剂并用二氯甲烷(2次)、N,N-二异丙基乙基铵二乙基二硫代氨基甲酸盐的DMF溶液(2次)、DMF(2次)洗树脂,得到化合物V。

步骤E.将步骤D得到的脱保护的树脂与步骤C中所述的N-甲基4-哌啶酸偶联,得到化合物VI。

步骤F.用ACT357将收集容器中的Fmoc保护的树脂VI等分到36个反应容器中,得到化合物VI1-36。

步骤G.按步骤B中所述将树脂(化合物VI1-36)与哌啶反应以除去FMOC基团。

步骤H.将得自步骤G的36等份脱保护树脂悬浮于DMF中。向各反应容器中加入溶于DMF的适宜羧酸(R1-36CO2H;3当量)、HATU(3当量)和NMM(7.5当量)。将容器振荡1小时。除去溶剂并用NMP(2次)、MeOH(2次)和DMF(2次)洗涤各等份的树脂。重复R1-36CO2H与各等份树脂偶联以及洗涤的步骤,得到化合物VIII1-36。

步骤I.用CH2Cl2(3次)洗涤各等份的树脂(化合物VIII1-36)。向各反应容器中加入90∶5∶5 TFA∶水∶二氯甲烷并将容器振荡120分钟。将溶剂从反应容器过滤到各个管中。用二氯甲烷(2次)和MeOH(2次)洗涤各等份的树脂并将滤液合并到各个管中。真空蒸发各个管,得到化合物IX1-36。

步骤J.将每种游离羧酸IX1-36溶解于DMF中。向各溶液中加入吡啶(1.05当量),然后再加入三氟乙酸四氟苯酯(1.1当量)。室温下将混合物搅拌45分钟。用EtOAc稀释溶液,用5%NaHCO3水溶液(3次)洗涤,用硫酸钠干燥,过滤并真空蒸发,得到化合物X1-36。                     实施例6

177

98809047.3说 明 书 第165/205页

一组式R1-36-Lys(ε-iNIP)-NBA-Tfp化合物的制备

图4举例说明平行地合成一组36种T-L-X化合物(X=Lh),其中Lh是活化的酯(具体说是四氟苯基酯),L是邻硝基苄胺基因,L是连接Lh和L之间的直接键,其中Lh直接连接到L基团的芳环上。T具有其中赖氨酸的羧酸基团已被连接到L苄胺基团氮原子上形成酰胺键的模块结构,且分子量可变部分R1-36(其中这些R基团相当于如本文定义的T,并可通过本文所列的任何一种特定的羧酸被导入)是通过赖氨酸的α氨基基团连接的,而质谱增强子基团(通过N-甲基4-哌啶酸被导入)则是通过赖氨酸的ε氨基基团连接的。 参见图4:

步骤A.按照实施例5的步骤A中所述的方法将NovaSyn HMP树脂与化合物I(按照Brown等,Molecular Diversity,1,4(1995)制备的NBA)偶联,得到化合物II。

步骤B-J.按照实施例5的步骤B-J所述处理树脂(化合物II),得到化合物X1-36。

                  实施例7

一组式iNIP-LYS(ε-R1-36)-ANP-Tfp化合物的制备

图5图解说明平行地合成一组36种T-L-X化合物(X=Lh),其中Lh是活化的酯(具体说是四氟苯基酯),L是邻硝基苄胺基团,L是连接Lh和L的亚甲基基团,T具有其中赖氨酸的羧酸基团已被连接到L苄胺基团氮原子上形成酰胺键的模块结构,且分子量可变部分R1-36(其中这些R基团相当于如本文定义的T,并可通过本文所列的任何一种特定的羧酸被导入)是通过赖氨酸的ε氨基基团连接的,而质谱灵敏度增强基团(通过N-甲基4-哌啶酸被导入)则是通过赖氨酸的α氨基基团连接的。 参见图5:步骤A-C.同实施例5。

步骤D.按实施例5的步骤B中所述用哌啶处理树脂(化合物IV),

178

2

2

2

2

3

2

2

2

22

3

98809047.3说 明 书 第166/205页

以除去FMOC基团。

步骤E.如实施例5步骤C所述将步骤D中树脂上的脱保护α-胺与N-甲基4-哌啶酸偶联,得到化合物V。步骤F.同实施例5。

步骤G.按实施例5步骤D所述用钯处理树脂(化合物VI1-36),以除去Aloc基团。

步骤H-J.按实施例7中所述的同样方法制备化合物X1-36。                     实施例8

一组式R1-36Glu(γ-DIAEA)-ANP-Tfp化合物的制备

图6图解说明平行合成一组36个T-L-X化合物(X=Lh),其中Lh是活化的酯(具体地是四氟苯基酯),L是邻硝基苄胺基团,L是连接Lh和L的亚甲基基团,T具有其中谷氨酸的α-羧酸基团已被连接到L苄胺基团氮原子上形成酰胺键的模块结构,且分子量可变部分R1-36(其中这些R基团相当于如本文定义的T,并可通过本文所列的任何一种特定的羧酸被导入)是通过谷氨酸的α氨基基团连接的,而质谱灵敏度增强基团(通过2-(二异丙基氨基)乙胺导入的)则是通过谷氨酸的γ-羧酸连接的。 参见图6:步骤A-B.同实施例5。

步骤C.按实施例5的步骤C中所述的偶联方法使脱保护的树脂(化合物III)与Fmoc-Glu-(OAI)-OH偶联,得到化合物IV。

步骤D.用二氯甲烷(2次)洗涤树脂(化合物IV)上的烯丙基酯并与(PPh3)4Pd(O)(0.3当量)和N-甲基苯胺(3当量)的二氯甲烷溶液混合。将混合物振荡1小时。除去溶剂并用二氯甲烷(2次)洗树脂。重复钯处理步骤。除去溶剂并用二氯甲烷(2次)、N,N-二异丙基乙铵二乙基二硫代氨基甲酸盐的DMF溶液(2次)、DMF(2次)洗树脂,得到化合物V。

步骤E.将得自步骤D的脱保护树脂悬浮在DMF中并通过与HATU

179

2

2

2

2

3

98809047.3说 明 书 第167/205页

(3当量)和NMM(7.5当量)混合进行活化。将容器振荡15分钟。除去溶剂并用NMP(1次)洗树脂。将树脂与2-(二异丙基氨基)乙胺(3当量)和NMM(7.5当量)混合。将容器振荡1小时。重复2-(二异丙基氨基)乙胺与树脂偶联以及洗涤的步骤,得到化合物VI。步骤F-J.同实施例5。

                        实施例9

一组式R1-36Lys(ε-INIP)-ANP-Lys(ε-NH2)-NH2化合物的制备 图7图解显示平行地合成一组36种T-L-X化合物(X=Lh),其中Lh是胺(具体地是赖氨酸衍生部分的ε-氨基),L是邻硝基苄胺基团,L是连接Lh和L的酰胺基取代的亚烷基氨基酰基亚烷基基团,T具有其中赖氨酸的羧酸基团已被连接到L苄胺基团氮原子上形成酰胺键的模块结构,且分子量可变部分R1-36(其中这些R基团相当于如本文定义的T,并可通过本文所列的任何一种特定的羧酸被导入)是通过赖氨酸的α氨基基团连接的,而质谱灵敏度增强基团(通过N-甲基4-哌啶酸被导入)则是通过赖氨酸的ε氨基基团连接的。 参见图7:

步骤A.将Fmoc-Lys(BOC)-SRAM树脂(可得自ACT;化合物I)与25%哌啶的DMF溶液混合并振荡5分钟.过滤树脂,然后与25%哌啶的DMF溶液混合并振荡10分钟。除去溶剂,用NMP(2次)、MeOH(2次)和DMF(2次)洗树脂,然后直接用于步骤B中。

步骤B.将树脂(化合物II)、ANP(可购自ACT;3当量)、HATU(3当量)和NMM(7.5当量)的DMF溶液加入到收集容器中并将收集容器振荡1小时。除去溶剂并用NMP(2次)、MeOH(2次)和DMF(2次)洗树脂。重复I与树脂偶联和洗涤的步骤,得到化合物III。步骤C-J.按实施例5步骤B-I所述方法处理树脂(化合物III),得到化合物X1-36。

                            实施例10

一组式R1-36-Lys(ε-TFA)-Lys(ε-iINP)-ANP-Tfp化合物的制备

180

2

2

3

2

2

98809047.3说 明 书 第168/205页

图8图解说明平行合成一组36个T-L-X化合物(X=Lh),其中Lh是活化的酯(具体地是四氟苯基酯),L是邻硝基苄胺基团,L是连接Lh和L的亚甲基基团,T具有其中第一个赖氨酸的羧酸基团已连接到L苄胺基团氮原子上形成酰胺键的模块结构,质谱灵敏度增强基团(通过N-甲基4-哌啶酸导入的)通过第一个赖氨酸的ε-氨基基团连接,第二个赖氨酸分子已通过第一个赖氨酸的α氨基基团连接到第一个赖氨酸上,分子量调整基团(具有三氟乙酰结构)则是通过第二个赖氨酸的ε氨基基团连接的,并且分子量可变部分R1-36(这些R基团相当于本文定义的T,并且可通过本文所示出的任何特定的羧酸被导入)通过第二个赖氨酸的α氨基基团连接。 参见图8:

步骤A-E.这些步骤与实施例5的步骤A-E完全相同。

步骤F.按实施例5中步骤B所述方法用哌啶处理树脂(化合物VI),以除去FMOC基团。

步骤G.使用实施例5步骤C中所述的偶联方法将脱保护的树脂(化合物VII)与Fmoc-Lys(Tfa)-OH偶联,得到化合物VIII。步骤H-K.按实施例5步骤F-J所述处理树脂(化合物VIII),得到化合物XI1-36。

                     实施例11

一组式R1-36-Lys(ε-iNIP)-ANP-5’-AH-ODN化合物的制备 图9举例显示了平行地合成一组36个T-L-X化合物(X=MOI,MOI是核酸片段ODN),该组化合物衍生于实施例5的酯(其中X是活化酯的其他T-L-X化合物可使用同样方法)。MOI通过磷酸二酯-亚烷基氨基借MOI的5’端连接到T-L上。 参见图9:

步骤A.按照Van Ness等,核酸研究,19,3345(1991)中所述的改良的生物素化方法制备化合物XII1-36。向其中一种5’-氨基己基寡核苷酸(化合物XI1-36,1mg)在200mM硼酸钠(pH8.3,250ml)中的溶液

181

2

22

2

3

98809047.3说 明 书 第169/205页

内加入一种四氟苯基酯(实施例A的化合物X1-36,在250ml NMP中的溶液,100倍摩尔过量)。在室温下保温反应过夜。经Sephadex G50色谱法从化合物XII1-36中除去未反应的和水解的四氟苯基酯。                         实施例12

一组式R1-36-Lys(ε-iNIP)-ANP-Lys(ε-(MCT-5’-AH-ODN))-NH2                      化合物的制备

图10举例显示平行地合成一组衍生于实施例11的胺的36种T-L-X化合物(X=MOI,MOI是核酸片段ODN)(可使用同样方法制备其中X是胺的其他T-L-X化合物)。MOI通过磷酸二酯-亚烷基氨基基团借MOI的5’端连接到T-L上。 参见图10:

步骤A.按Van Ness等,核酸研究,19,3345(1991)中描述的方法制备5’-[6-(4,6-二氯-1,3,5-三嗪-2-基氨基)己基]寡核苷酸XII1- 36。

步骤B.向浓度为1mg/ml的一种5’-[6-(4,6-二氯-1,3,5-三嗪-2-基氨基)己基]寡核苷酸(化合物XII1-36)在100mM硼酸钠(pH8.3)中的溶液中加入100倍摩尔过量的选自R1-36-Lys(ε-iNIP)-ANP-Lys(ε-NH2)NH2的伯胺(实施例11中的化合物X1-36)。室温下将溶液混合过夜。使用H2O作为洗涤溶液通过3000MW截留值的膜(Amicon,Beverly,MA)超滤除去未反应的胺(3次)。使体积减少到100ml以分离化合物XIII1-36。

                     实施例13

           演示用质谱法同时检测多个标记

本实施例描述质谱检测法同时检测多个化合物(标记)的能力。在该特定实施例中,将31种化合物与基质混合,沉积在固相载体上并干燥之,然后用激光解吸。将所得到的离子导入质谱仪中。 等摩量混合下列化合物(购自Aldrich,Milwaukee,WI)以达到

182

98809047.3说 明 书 第170/205页

0.002M的终浓度(每种化合物):苯甲酰胺(121.14)、烟酰胺(122.13)、吡嗪酰胺(123.12)、3-氨基-4-吡唑羧酸(127.10)、2-噻吩甲酰胺(127.17)、4-氨基苯甲酰胺(135.15)、甲苯酰胺(135.17)、6-甲基烟酰胺(136.15)、3-氨基烟酰胺(137.14)、烟酰胺N-氧化物(138.12)、3-氢吡啶酰胺(138.13)、4-氟苯甲酰胺(139.13)、肉桂酰胺(147.18)、4-甲氧基苯甲酰胺(151.17)、2,6-二氟苯甲酰胺(157.12)、4-氨基-5-咪唑-甲酰胺(162.58)、3,4-哌啶-二甲酰胺(165.16)、4-乙氧基苯甲酰胺(165.19)、2,3-吡嗪二甲酰胺(166.14)、2-硝基苯甲酰胺(166.14)、3-氟-4-甲氧基苯甲酸(170.4)、吲哚-3-乙酰胺(174.2)、5-乙酰水杨酰胺(179.18)、3,5-二甲氧基苯甲酰胺(181.19)、1-萘乙酰胺(185.23)、8-氯-3,5-二氨基-2-吡嗪甲酰胺(187.59)、4-三氟甲基苯甲酰胺(1.00)、5-氨基-5-苯基-4-吡唑甲酰胺(202.22)、1-甲基-2-苄基-丙酰胺酸酯

(207.33)、4-氨基-2,3,5,6-四氟苯甲酰胺(208.11)、2,3-萘二甲酸(212.22)。将这些化合物以上述浓度放在DMSO中。然后将1μl材料与α-氰基-4-羟基肉桂酸基质(1∶10,000稀释之后)混合并沉积到固体不锈钢载体上。

然后使用Protein TOF质谱仪(Bruker,Manning Park,MA)用激光照射以使材料解吸,并以线性和反射操作模式检测所得离子。观察到下列m/z值(图11):121.1-->苯甲酰胺(121.14)122.1-->烟酰胺(122.13)123.1-->吡嗪酰胺(123.12)124.1125.2

127.3-->3-氨基-4-吡唑甲酸(127.10)127.2-->2-噻吩甲酰胺(127.17)135.1-->4-氨基苯甲酰胺(135.15)135.1-->甲苯酰胺(135.17)

183

98809047.3136.2-->6-甲基烟酰胺(136.15)137.1-->3-氨基烟酰胺(137.14)138.2-->烟酰胺N-氧化物(138.12)138.2-->3-氢吡啶酰胺(138.13)139.2-->4-氟苯甲酰胺(139.13)140.2

147.3-->肉桂酰胺(147.18)148.2149.2

4-甲氧基苯甲酰胺(151.17)152.2

2,6-二氟苯甲酰胺(157.12)158.3

4-氨基-5-咪唑-甲酰胺(162.58)163.3

165.2-->3,4-吡啶-二甲酰胺(165.16)165.2-->4-乙氧基苯甲酰胺(165.19)166.2-->2,3-吡嗪二甲酰胺(166.14)166.2-->2-硝基苯甲酰胺(166.14) 3-氟-4-甲氧基苯甲酸(170.4)171.1172.2173.4

吲哚-3-乙酰胺(174.2)178.3

179.3-->5-乙酰水杨酰胺(179.18)181.2-->3,5-二甲氧基苯甲酰胺(181.19)182.2-->

1-萘乙酰胺(185.23)

说 明 书 第171/205页

184

98809047.3说 明 书 第172/205页

186.2

8-氯-3,5-二氨基-2-吡嗪甲酰胺(187.59)188.2

1.2-->4-三氟甲基-苯甲酰胺(1.00)190.2191.2192.3

5-氨基-5-苯基-4-吡唑-甲酰胺(202.22)203.2203.4

1-甲基-2-苄基-丙酰胺酸酯(207.33) 4-氨基-2,3,5,6-四氟苯甲酰胺(208.11)212.2-->2,3-萘二甲酸(212.22)219.3221.2228.2234.2237.4241.4

数据表明31种化合物中有22种以预期的质量出现在质谱中,31种化合物中有9种以超过预期质量的n+H质量(1个原子质量单位,amu)出现在质谱中。后一种现象可能是由于化合物内胺的质子化作用。因此31种化合物均可用MALDI质谱法检测。更重要的是,该实施例证明可用质谱法同时检测多个标记。

单独α-氰基基质(图11)在146.2、1.1、172.1、173.1、1.1、190.1、191.1、192.1、212.1、224.1、228.0、234.3处产生峰。光谱中鉴定到的其他质量是由于没有对所购买的化合物进一步纯化而带的污染物。

185

98809047.3说 明 书 第173/205页

                      实施例14                  微卫星标志:PCR扩增

使用下述标准PCR条件扩增微卫星标志。简单地说,在含有40ng基因组DNA、各50pmol引物、0.125mM各种dNTP和1单位Tag聚合酶的总体积50μl反应混合物中完成PCR反应。1X扩增缓冲液含有10mM Tris碱,pH9,50mM KCl、1.5mM MgCl2、0.1%Triton X-100和0.01%明胶。使用“热起始”程序进行反应:在96℃5分钟第一次变性步骤后加入Taq聚合酶。经35次循环完成扩增:变性(94℃,40秒)和退火(55℃,30秒)。最后一次退火后以延伸步骤(72℃,2分钟)终止扩增过程。因为将得到的扩增产物较短(90至350bp长)并且温度从55℃升高到94℃(以1℃/秒的上升率达到的)的时间间隔足够长,所以没有72℃的步骤即可完成DNA延伸。                       实施例15                    DNA片段的分离装置

DNA片段的分离可以用由多个标准部件组装成的HPLC系统进行。这些部件包括至少两个可将溶剂泵过高压梯度混合器的高压泵、一个注射器、HPLC柱和一个检测器。注射器是自动化的、可程序控制的自动进样器,它通常能够在室温或低于室温下存放80-100个样品以保持样品的稳定性。自动注射器还可以在完全无人看管的条件下以可重现的方式进行μL大小的注射。HPLC柱包含在能够将确定的温度保持在0.1℃内的加热的柱室内。以下实施例中所用的柱子是从SeraSep(San Jose,CA)以DNASep的商品名购得的。该柱子是带有2.2μm被C18烷基化的无孔聚苯乙烯二乙烯基苯共聚物颗粒的55×4.6mm的柱子。装柱材料在2-12的pH范围内稳定并且可以耐受高达70℃的温度。分析物的检测采用单或多波长的UV检测器或二极管阵列检测器。方法

186

98809047.3说 明 书 第174/205页

用于该实施例的分离DNA片段的方法采用离子对色谱,在该色谱法中,溶液中的离子可以配对或被中和并以离子对的形式在反相柱上分离。抗衡离子的亲脂特性和浓度决定了分析物的保留程度。对于DNA分子,亲脂性的阳离子缓冲成分可与DNA骨架的阴离子磷酸基团配对。缓冲成分还可与固定相的烷基相互作用。然后逐渐增加乙腈的浓度使流动相的有机性逐渐增强,将配对的DNA根据大小洗脱。用酶消化质粒或市售的DNA梯来评估各种胺盐的适用性。洗脱DNA所需的乙腈的范围以及柱室的温度根据评估的各缓冲液而改变。缓冲液

用于评估其离子配对能力的缓冲液从储备液制备。为了使整个梯度中离子配对试剂的浓度保持相同,向水和乙腈流动相中均加入离子配对试剂。在进行分离之前,将柱子用新的流动相以50μl/分钟的流速平衡约18小时。在对流动相进行了评估之后,撤走流动相并将柱子依次用800ml 0.1%甲酸的50%乙腈溶液、800ml 0.1%乙酸的50%乙腈溶液洗涤,然后用新的流动相平衡。A.nn-二甲基辛铵三氟乙酸盐

将0.5当量三氟乙酸溶于适宜体积的水中并缓慢加入1当量nn-二甲基辛胺,制备1M二甲基辛铵三氟乙酸盐的储备液。该储备液的pH值为7。将该储备液用适宜体积的水或乙腈稀释成使用浓度。B.nn-二甲基庚铵乙酸盐

将1当量冰乙酸溶于适宜体积的水中并缓慢加入1当量nn-二甲基庚胺,制备1M二甲基庚铵乙酸盐的储备液。该储备液的pH值为6.6。将该储备液用适宜体积的水或乙腈稀释成工作浓度。C.nn-二甲基己铵乙酸盐

187

98809047.3说 明 书 第175/205页

将1当量冰乙酸溶于适宜体积的水中并缓慢加入1当量nn-二甲基己胺,制备1M二甲基己铵乙酸盐的储备液。该储备液的pH值为6.5。将该储备液用适宜体积的水或乙腈稀释成工作浓度。D.nn-二甲基丁铵乙酸盐

将1当量冰乙酸溶于适宜体积的水中并缓慢加入1当量nn-二甲基丁胺,制备1M二甲基丁铵乙酸盐的储备液。该储备液的pH值为6.9。将该储备液用适宜体积的水或乙腈稀释成工作浓度。E.nn-二甲基异丙铵乙酸盐

将1当量冰乙酸溶于适宜体积的水中并缓慢加入1当量nn-二甲基异丙胺,制备1M二甲基异丙铵乙酸盐的储备液。该储备液的pH值为6.9。将该储备液用适宜体积的水或乙腈稀释成工作浓度。F.nn-二甲基环己基铵乙酸盐

将1当量冰乙酸溶于适宜体积的水中并缓慢加入1当量nn-二甲基环己基胺,制备1M二甲基环己基铵乙酸盐的储备液。该储备液的pH值为6.5。将该储备液用适宜体积的水或乙腈稀释成工作浓度。G.甲基哌啶乙酸盐

将1当量冰乙酸溶于适宜体积的水中并缓慢加入1当量1-甲基哌啶制备1M甲基哌啶乙酸盐的储备液。该储备液的pH值为7。将该储备液用适宜体积的水或乙腈稀释成工作浓度。H.甲基吡咯烷乙酸盐

将1当量冰乙酸溶于适宜体积的水中并缓慢加入1当量1-甲基吡咯烷制备1M吡咯烷乙酸盐的储备液。该储备液的pH值为7。将该储备液用适宜体积的水或乙腈稀释成工作浓度。

188

98809047.3说 明 书 第176/205页

I.三乙铵乙酸盐

从Glenn Research Sterling,Virginia购得2M三乙铵乙酸盐的储备液(pH7)。将该储备液用适宜体积的水或乙腈稀释成工作浓度。

                      实施例16                       DNA指纹

制备含有核心序列和酶特异性序列的DNA指纹衔接子。EcoR1衔接子的结构是5’-CTCGTAGACTGCGTACC(SEQ ID N0),Mse1衔接子的结构是5’-GACGATGAGTCCTGAG。

稀有切割酶的衔接子与EcoR1的相同,不同的是使用粘性末端。ALPH引物由三部分组成:核心序列、酶特异性序列和选择性延伸序列。下列为EcoR1和Mse1引物:EcoR1:5’-gactgcgtaaa-aattc-NNN(SEQ ID No.);Mse1:5’-gatgagtcctgag-taa-NNN(SEQ IDNo.)。

在37℃,将基因组DNA与5单位EcoR1和5单位Mse1在40μl含10mM Tris-乙酸pH7.5,10mM MgAce,50mM乙酸钾,5mM DTT,50ng/μl BSA,5mM DTT溶液中保温1小时。接着,加入10μl含5pMol EcoRI衔接子、50pMol MseI衔接子、1单位T4连接酶、1mM ATP的10mM Tris乙酸pH7.5,10mM MgAce,50mM乙酸钾,5mMDTT,5mM DTT、50ng/μl BSA溶液,然后在37℃保温3小时。衔接子是通过加入等摩尔的两个链制备的衔接子不需磷酸化。连接后,将反应混合物用10mM Tris HCl,0.1mM EDTA pH8.0稀释至500μl,然后于-20℃贮存。

遗传指纹反应:用用于EcoRI/MseI酶组合的DNA模板描述扩增反应。用适宜的引物完成利用其他酶组合的基因组指纹分析。扩增反应通常使用两种寡核苷酸,一种对应于EcoRI末端,另一种对应于MseI末端。将两引物之一用CMST标记标记,优选标记EcoRI引物。用5ng标记的EcoRI引物,30ng MseI引物,5微升模板DNA,

1

98809047.3说 明 书 第177/205页

0.4单位Taq聚合酶,10mM Tris-HCl,pH8.3,1.5mM MgCl2,50mM KCl,0.2mM dATP,dGTP,dCTP,dTTP完成PCR反应。PCR反应随扩增所用DNA指纹引物的选择性扩增延伸物的性质而不同。用有两个或三个选择性核苷酸的引物进行的DNA指纹反应用下列循环模式完成36个循环:94℃,DNA变性30秒,55℃退火30秒,然后在72℃延伸1分钟。第一步中的退火温度是65℃,在接下来的12个循环中,每循环步骤降低0.7℃,然后在剩下的23个循环中是56℃。用MJ热循环仪(Watertown MA)完成所有扩增反应。

复杂基因组(如人)的DNA指纹法包括两个扩增步骤。按照上述,用含有单个选择性核苷酸的两种DNA指纹法完成预扩增,不同的是使用30ng的两个DNA指纹引物,而且这些引物不用CMST标记,预扩增步骤后,将反应混合物用10mM Tris-HCl,0.1mM EDTA,pH8.0稀释10倍,然后用作第二个扩增反应的模板。按上述有关DNA指纹反应的描述完成第二个扩增反应,所述引物含有较长的选择性延伸。

用HPLC分析扩增反应的产物。用HPLC仪器(Rainin,Emeryville,CA.,或Hewlett Packard,Palo Alto,CA)完成HPLC。将注射到HPLC前在95℃变性了3分钟的未纯化DNA指纹产物用1.8%/分钟线性乙腈(ACN,J.T.Baker,NJ)梯度,以0.9ml/分钟的流速洗脱。按照扩增产物的大小调整起点和终点。成功分辨在DNA指纹分析过程中产生的分子所需的温度是50℃。然后,将HPLC洗脱液直接加至质谱仪(Hewlett Packard,Palo Alto,CA)上,检测标记。 以所列的顺序洗脱下列片段(位置号是λ基因组内裂解位点的位置):47,78,

  91,733,1456,2176,3275,3419,4349,444,5268,5709,6076,6184,6551,7024,7949,  8062,8200,8461,9079,9253,9692,9952,11083,11116,11518,11584,12619,12967,  14108,142,15628,15968,16034,16295,16859,18869,19137,19482,20800,  21226,21441,2635,21702,21903,21948,22724,23048,23084,23111,23206,23279,  23285,23479,23498,23555,23693,23887,23979,23987,24073,24102,24751,  24987,25170,25255,25353,25437,26104,25578,25746,25968,26133,226,  251,283,26523,26585,26651,26666,26679,26693,26763,26810,26984,

190

98809047.3说 明 书 第178/205页

26993,27038,27092,27203,27317,27683,28456,28569,222,272,29374,29981,30822,30620,30639,30722,30735,30756,31169,31747,31808,32194,32218,321,32704,33222,33351,33688,33736,33748,33801,34202,34366,34406,34590,34618,34684,34735,34753,34831,35062,35269,35534,35541,36275,36282,36303,330,392,36531,36543,36604,36736,36757,36879,37032,37442,37766,37783,37882,37916,37994,361,38287,38412,38834,39168,44972,39607,39835,40127,40506,40560,40881,41017,41423,41652,41715,42317,42631,42651,42673,42814,43410,43492,43507,43528,43593,44424,44538,44596,44868,45151,45788,46033,408,46556,46804,46843,46853,466,46952,47256,47274,47287,47430,47576,47699,47799,48059,48125,48227,48359,48378.

平均片段长度约160nt。观察到的裂解位点与从MseI/EcoRI图谱上预测的基本上一致(>95%)。                        实施例17                单核苷酸延伸检测方法

RNA制备:用来自Promega(WI)的RNA分离试剂盒,从Jurkat细胞(用指数生长期的1×10细胞)制备总RNA。将RNA分成两份贮存:1)焦碳酸二乙酯处理ddH2O中的储备液等分贮存于-20℃,并2)作为100%水中的悬浮液长期贮存。

反转录:按Ausubel等(Ausubel等,《分子生物学最新方法》(Current Protocols in Molecular Biology),1991,GreenePublishing Associates/Wiley-Interscience,NY,NY)所述完成总RNA的poly(dT)引发反转录,不同的是将反应扩大为用1μg总RNA。将20-50单位反转录酶(Promega)用10%甘油、10mM KPO4pH7.4,0.2%Triton X-100和2mM DTT稀释10倍,然后在加入至反应前在冰上放置30分钟。用在20μl反应液中的10mM Tris-HCl pH8.3,50mM KCl,M MgCl2,1mM dNTP,2U/μl RNAsin(Gibco-BRL),0.1μM寡聚体和0.125U/μl M-MLV反转录酶(Gibco-BRL)反转录的1μgJurkat总RNA完成下述GADPH和其它对照基因的基因特异性反转录。在42℃将反应液保温15分钟,在95℃加热5分钟失活,然后用(10mM Tris HCl pH8.3,1mM NH4Cl,1.5M MgCl2,100mM KCl)、

191

9

98809047.3说 明 书 第179/205页

0.125mM NTPs,10ng/ml相应的寡核苷酸引物和0.75单位TAQ聚合酶(Gibco-BRL)的母混合物稀释至100μl以进行PCR扩增。 PCR:用跨已知内含子/外显子边界的基因特异性引物(见下文)进行每个基因的PCR。所有PCR均在含10mM Tris HCl pH8.3,1mMNH4Cl,1.5M MgCl2,100mM KCl、0.125mM NTP,10ng/ml相应寡核苷酸引物和0.75单位TAQ聚合酶(Gibco-BRL)的20μl溶液中完成。循环参数是94℃预热5分钟,然后94℃变性1分钟、55℃退火2分钟、72℃延伸30秒-1分钟进行循环,最后在72℃延伸10分钟。扩增数一般为30-45个循环。

模板的纯化:按Zhen和Swank(Zhen and Swank,BioTechniques,14(6):4-8,1993)所述,凝胶纯化PCR产物。用0.04M Tris-乙酸,0.001 M EDTA(1x TEA)缓冲液,在1%琼脂糖凝胶上分离PCR产物,然后用溴化乙锭染色,同时用UV光肉眼观察。在所研究条带的前沿切一个槽,用50-200μl在1x TEA缓冲液中的10%PEG填充。继续电泳直到带完全进入槽。然后取出内含物并用酚、氯仿提取,然后用0.1体积7.5M乙酸铵和2.5体积100%EtOH沉淀。将样品用75%EtOH洗涤,然后在室温下稍微干燥。通过在1xTBE缓冲液中于1%琼脂糖凝胶上电泳少量样品,用溴化乙锭染色并与已知标准物比较,来确定产率。

在含约100ng扩增DNA片段、1μM SNuPE引物、2单位Taq聚合酶和1μl适宜dNTP的50μl溶液中完成每个SNuPE反应。在该类检测中,所有dNTP均不标记。所用的缓冲液是10mM Tris-HCl(pH8.3),50mM KCl,5mM MgCl2和0.001%(wt/vol)明胶。将样品经由95℃变性2分钟、60℃退火2分钟和72℃引物延伸2分钟组成的循环。下面描述每个家族的SNUPE引物的序列。

引物延伸:按Singer-Sam等(Singer-Sam等,PCR方法和应用1:160-163,1992)所述完成单核苷酸引物延伸,不同的是在每种反应中使用1mM Mg++,0.1μM引物和0.05μM每种dNTP。上述的每种引物延伸后,加入1/5体积的上样染料(80%甲酰胺、0.1%溴酚蓝,

192

98809047.3说 明 书 第180/205页

0.1%二甲苯腈蓝,2mM EDTA),将整个样品在15%变性聚丙烯酰胺凝胶上电泳。将凝胶用10%甘油、10%甲醇、10%冰醋酸固定,同时匀速振荡,然后用10%甘油洗涤。然后将凝胶在55℃干燥3-5小时。 Rychlik(Rychlik,BioTechniques 18:84-90,1995)描述了本试验所描述的引物。引物可以合成,或者作为凝胶过滤级引物从Midland Certified Reagent Company(Midland Texas)得到。扩增是以TAQ DNA聚合酶为基础(10mM Tris-HCl pH8.3,1.5mM MgCl2,50mM KCl)或者以Pfu DNA聚合酶为基础(20mM Tris-HCl pH8.3,2.0mM MgCl2,10mM KCl,10mM(NH4)2SO4,0.1%Triton X-100,0.1mg/ml牛血清白蛋白)的。在反应液中,总三磷酸核苷(NTP)的浓度为0.8mM,引物浓度是200nM(除非特别说明),模板的量是每20μl反应液0.25ngλ噬菌体DNA。循环参数是94℃预热5分钟,然后94℃变性1分钟、55℃退火2分钟、72℃延伸30秒-1分钟,最后在72℃延伸10分钟。通常扩增30-45个循环。

选择λ噬菌体基因组(GenBank Accession#J02459)中的两个区域作为扩增的引发位点。5’-引物有稳定的GC富集的3’末端:选择3’引物以便产生381bp产物。5’正向引物是H17:5’-GAACGAAAACCCCCCGC(SEQ ID No.)。3’反向引物是RP17:GATCGCCCCCAAAACACATA(SEQ ID No.)。

然后检测扩增产物是否在位置31245存在多态现象。在四种单核苷酸延伸检测中使用以下引物SNE17:5’-GAACGAAAACCCCCCGC(SEQID NO.)。然后按上述完成四种单核苷酸延伸检测。将所有反应物集中,将5μl集中的物质不用进一步纯化即注射到HPLC柱(SeraSep,San Jose,CA)上。

用自动HPLC仪器(Rainin,Emeryville,CA.,或HewlettPackard,Palo Alto,CA)完成HPLC。将注射至HPLC前在95℃变性了3分钟的未纯化SNEA产物用1.8%/分钟的线性乙腈(ACN,J.T.Baker,NJ)梯度以0.9ml/分钟的流速洗脱。根据SNEA产物的大小调整起点和终点。成功分辨SNEA分子所需的温度是50℃。然后将

193

98809047.3说 明 书 第181/205页

HPLC洗脱液直接加至质谱仪(Hewlett Packard,Palo Alto,CA)中,检测标记,结果列于表2。 表2

标记引物SNE17-487SNE17-496SNE17-503SNE17-555

ddNTP类型ddATPddGTPddCTPddTTP

保留时间2.5分钟2.5分钟4.6分钟2.5分钟

延伸?否否是否

因此,结果表明在4.6分钟的保留时间检测到质谱标记(CMST),这说明SNE17引物是由一个碱基(ddCTP)延伸的,因此,在31245位的多态现象在这种情况下是“G”。SNE17-487、SNE17-496和SNE17-555标记的引物不被延伸,而且其在HPLC上的保留时间分别为2.5分钟。

                      实施例18

在实施例(18)中,所有的反应均在箔覆盖的烧瓶中进行。在图19A和19B中举例说明了该实施例中描述的A→F的反应顺序。该实施例中所述的化合物号是指与图19A和19B中相同号的化合物。 A.向ANP接头(化合物1,11.2mmol)和二异丙基乙胺(22.4mmol)的三氯甲烷(60毫升)溶液中加入烯丙基溴

(22.4mmol)。将反应混合物回流3小时,室温搅拌18小时,用氯仿(200毫升)稀释,然后用1.0M HCl(2×150ml)和H2O(2×150ml)洗涤。将有机提取物干燥(硫酸镁)并蒸除溶剂得到黄色固体状化合物2。

向化合物2的二氯甲烷(70毫升)溶液中加入三(2-氨基乙基)胺(50毫升)并将反应混合物室温搅拌18小时。将反应液用二氯甲烷(150毫升)稀释并用pH6.0的磷酸盐缓冲液(2×150ml)洗涤。将有机提取物干燥(硫酸镁)并蒸除溶剂。将残余物进行柱色谱分离(己

194

98809047.3说 明 书 第182/205页

1

烷/乙酸乙酯)得到1.63g(58%)化合物3:H NMR(DMSO-d6):δ7.85(dd,

  2H),7.70(t,1H),7.43(t,1H),5.85(m,1H),5.20(q,2H),4.58(q,1H),4.50(d,2H),  2.70(m,2H),2.20(br s,2H).

B.向Boc-5-氨基戊酸(1.09mmol)和NMM(3.27mmol)的无水DMF(6毫升)溶液中加入HATU(1.14mmol),然后将反应混合物室温搅拌0.5小时。加入化合物3(1.20mmol)的无水DMF(1毫升)溶液并将反应混合物室温搅拌18小时。将反应液用乙酸乙酯(50毫升)稀释并用1.0M HCl(2×50ml)和去离子水(2×50ml)洗涤。将有机提取物干燥(硫酸镁)并蒸发至干。将残余物进行柱色谱分离得到420mg(91%)化合物4。H NMR(DMSO-d6):δ 8.65(d,

  1H),7.88(d,1H),7.65(m,2H),7.48(t,1H),6.73(br s,1H),5.85(m,1H),5.55(m,  1H),5.23(q,2H),4.55(d,2H),2.80(m,2H),2.05(t,2H),1.33(s,9H),1.20-1.30(m,  4H).

C.将化合物4(0.9mmol)的HCl·1,4-二噁烷(20mmol)溶液室温搅拌2小时。将反应混合物浓缩,溶于甲醇和甲苯,再次浓缩(5×5ml)得到398mg(定量)化合物5:H NMR(DMSO-d6):δ 8.75(d,1H),7.88(d,

  1H),7.65(m,2H),7.51(t,1H),7.22(m,2H),5.85(m,1H),5.57(m,1H),5.23(q,2H),  4.55(d,2H),2.80(m,2H),2.71(m,2H),2.07(s,2H),1.40-1.48(br s,4H). D.向化合物21(0.48mmol,按照实施例20制备)和NMM(1.44mmol)的无水DMF(3毫升)溶液中加入HATU(0.50mmol)并将反应混合物室温搅拌0.5小时。加入化合物5(0.51mmol)的无水DMF(3毫升)溶液并将反应液室温搅拌18小时。将反应混合物用乙酸乙酯(75毫升)稀释并用5%碳酸钠(3×50ml)洗涤。将有机提取物干燥(硫酸镁)并蒸除溶剂得到281mg(78%)化合物6:

195

1

1

98809047.3

1

说 明 书 第183/205页

H NMR(DMSO-d6):δ8.65

  (d,1H),8.17(d,1H),7.82-7.95(m,4H),7.68(m,3H),7.50(t,1H),6.92(d,1H),5.85  (m,1H),5.57(m,1H),5.20(q,2H),4.55(d,2H),4.30(q,1H),4.05(q,2H),2.95(m,  4H),2.80(m,2H),2.72(m,2H),2.05(s,3H),2.01(t,2H),1.58-1.77(m,3H),1.50(m,  4H),1.30(q,3H),1.17-1.40(m,9H).

E.向化合物6(0.36mmol)的THF(4毫升)溶液中加入1M氢氧化钠(1mmol)并将反应液室温搅拌2小时。将反应混合物用1.0M HCl(1ml)酸化至pH7.0并蒸除溶剂得到化合物7(定量):

H NMR(DMSO-d6):δ8.65(d,1H),

8.17(d,1H),7.82-7.95(m,4H),7.68(m,3H),7.50(t,1H),6.92(d,1H),5.52(m,1H), 4.30(q,1H),4.05(q,2H),2.95(m,4H),2.80(m,2H),2.72(m,2H),2.05(s,3H),2.01 (t,2H),1.58-1.77(m,3H),1.50(m,4H),1.30(q,3H),1.17-1.40(m,9H). F.向化合物7(0.04mmol)和NMM(0.12mmol)的无水DMF(0.4ml)溶液中加入HATU(0.044mmol)并将反应液室温搅拌0.5小时。加入烯丙基胺(0.12mmol)并将反应混合物室温搅拌5小时。将反应混合物用乙酸乙酯(15毫升)稀释并用5%碳酸钠(3×10ml)洗涤。将有机提取物干燥(硫酸镁)并蒸除溶剂得到15mg(49%)化合物8:H

NMR(DMSO-d6)δ8.49(d,1H),8.17(d,1H),7 82-7.95(m,4H),7.68(m,3H),7.50(t, 1H),6.92(d,1H),5.72(m,1H),5.50(m,1H),5.03(q,2H),4.37(d,2H),4.30(q,1H), 4.05(q,2H),2.95(m,4H),2.80(m,2H),2.72(m,2H),2.05(s,3H),2.01(t,2H),1.58- 1.77(m,3H),1.50(m,4H),1.30(q,3H),1.17-1.40(m,9H).                   实施例19

在图20A和20B中举例说明了实施例19中描述的A→G的反应顺序。该实施例中所述的化合物号是指与图20A和20B中相同号的化合物。

A.向Fmoc-Lys(Boc)-OH(化合物9,33.8mmol)的氯仿(200毫升)溶液中加入二异丙基乙胺(67.5mmol)和烯丙基溴(67.5mmol)。将反应混合物回流6小时,室温搅拌16小时,用氯仿稀释,用1.0MHCl(2×150ml)、饱和碳酸氢钠溶液(1×150ml)和去离子水(2×

196

1

1

98809047.3说 明 书 第184/205页

150ml)洗涤。将有机提取物干燥(硫酸镁)并蒸除溶剂得到化合物10。

向化合物10的氯仿(90毫升)溶液中加入吡咯烷(10当量)并将反应混合物室温搅拌2.5小时。将反应混合物用氯仿(150毫升)稀释并用饱和碳酸氢钠溶液(3×250ml)洗涤。将有机提取物干燥(硫酸镁)并蒸除溶剂。将残余物进行柱色谱分离(乙酸乙酯/甲醇)得到6.52g(67%)化合物11。

1

H NMR(CDCl3):δ5.90(m,1H),5.27(m,2H),4.60(d,2H),3.48(t,

  1H),3.10(d,2H),1.40-1.78(m,9H),1.40(s,9H). B.向N-甲基4-哌啶酸(1.60mmol)和N-甲基吗啉(4.80mmol)的无水DMF(5毫升)溶液中加入HATU(1.67mmol)。0.5小时后,加入化合物11(1.75mmol)的无水DMF(2毫升)溶液并将反应混合物室温搅拌18小时。将反应液用二氯甲烷(60毫升)稀释并用饱和碳酸钠溶液(3×40ml)洗涤。将有机提取物干燥(硫酸镁)并蒸除溶剂。将残余物进行柱色谱分离(二氯甲烷/甲醇/三乙胺)得到580mg(88%)化合物12:

H NMR(DMSO):δ8.12(d,1H),6.77(t,1H),5.90(m,1H),

5.27(m,2H),4.53(d,2H),4.18(m,1H),2.62-2.90(m,5H),2.13(s,3H),1.85(m, 2H),1.57(m,5H),1.35(s,9H),1.00(t,2H).

C.将化合物12(1.39mmol)的HCl·1,4-二噁烷(20mmol)溶液室温搅拌4

小时。将反应混合物浓缩,溶于甲醇,与甲苯共同蒸发(5×5ml)得到527mg(定量)化合物13:H NMR(DMSO-d6):δ 8.12(d,1H),6.77(t,1H),5.90

(m,1H),5.27(m,2H),4.53(d,2H),4.18(m,1H),2.65-3.00(m,8H),2.23(s,3H),1.85 (m,2H),1.57(m,5H),1.00(t,2H).

D.向4-乙氧基苯甲酸(1当量)的无水DMF溶液中加入NMM(3当量)和HATU(1.05当量)。0.5小时后,加入化合物13的无水DMF溶液。反应结束并经碱处理后,将化合物14分离并纯化。

197

1

1

98809047.3说 明 书 第185/205页

E.向化合物14的THF溶液中加入1N氢氧化钠并将反应混合物室温搅拌。反应结束并酸化后,分离得到化合物15。

F.向化合物15(1当量)的无水DMF溶液中加入NMM(3当量)和HATU(1.05当量)。0.5小时后,加入化合物21(ANP-烯丙基酯,按照实施例20制备)的无水DMF溶液。反应结束并经碱处理后,将化合物16分离并纯化。

G.向化合物16的THF溶液中,加入1N氢氧化钠并将反应混合物室温搅拌。反应结束并酸化后,分离得到化合物17。                     实施例20

在图21中举例说明了实施例20中描述的A→D的反应顺序。该实施例以及实施例18和19中所述的化合物号指与图21中相同号的化合物。

A.向4-乙氧基苯甲酸(7.82mmol)和N-甲基吗啉(20.4mmol)的二氯甲烷(10毫升)溶液中加入HATU(7.14mmol)。0.25小时后,加入化合物11(6.8mmol)的二氯甲烷(6毫升)溶液并将反应混合物室温搅拌18小时。将反应液用二氯甲烷(150毫升)稀释,用1.0M HCl(3×50ml)和饱和碳酸氢钠溶液(3×50ml)洗涤。将有机提取物干燥(硫酸镁)并蒸除溶剂。将残余物进行柱色谱分离(二氯甲烷/甲醇)得到2.42g(82%)

化合物18:H NMR(CDCl3):δ7.78(d,2H),6.91(d,2H),6.88(d,1H),5.83- 5.98(m,1H),5.21-5.38(m,2H),4.80(q,1H),4.66(d,2H),4.06(q,2H),3.11(q,2H), 1.90-2.04(m,1H),1.68-1.87(m,1H),1.39(t,3H),1.34(s,9H),1.32-1.58(m,4H). B.将化合物18(5.5mmol)的HCl·1,4-二噁烷(14.3mmol)溶液室温搅拌1小时。将反应混合物浓缩,溶于甲醇,与甲苯共沸,再次浓缩(5×5ml)得到定量收率的化合物19。

C.向N-甲基4-哌啶酸(6.21mmol)的无水DMF(15毫升)溶液中加入NMM(21.6mmol)和HATU(5.67mmol)。0.5小时后,加入化合物19(5.4mmol)的无水DMF(10毫升)溶液并将反应混合物室温搅拌18小

198

1

98809047.3说 明 书 第186/205页

时。将反应混合物用1N氢氧化钠(20毫升)调至pH12并用氯仿萃取(2×200ml)。将有机提取物干燥(硫酸镁)并蒸除溶剂得到2.2g(%)

化合物20:H NMR(DMSO-d6):δ8.52(d,1H),7.84(d,2H),7.72(t,1H),6.95(d,  2H),5.80-5.95(m,1H),5.18-5.31(dd,2H),4.58(d,2H),4.37(q,1H),4.08(q,2H),  3.01(d,2H),2.08(s,3H),1.95(m,1H),1.63-1.82(m,4H),1.51(m,4H),1.32(t,3H),  1.22-1.41(m,6H).

D.向化合物20(4.4mmol)的THF(10ml)溶液中,加入1N氢氧化钠(4.4mmol)并将反应混合物室温搅拌1小时。将反应液浓缩,溶于THF/甲苯

(2× 5ml),浓缩,溶于二氯甲烷/甲苯(1×5ml)并再次浓缩,以定量收率得到混合物21:

H NMR(DMSO-d6):δ7.76(d,2H),6.96(d,2H),

4.04(q,2H),3.97(d,1H),2.97(d,2H),2.(d,2H),2.08(s,3H),1.95(m,1H),1.58- 1.79(m,4H),1.44(m,6H),1.30(t,3H),1.11-1.35(m,4H).                        实施例21

CMST(可通过质谱法检测的可裂解标记)的合成可以基于图22所述的组合方法。该一般性方法可以适应质谱仪的发展以及电离技术的变化和改进。首先测试中心支架与该方法中所采用的电离类型的相容性。重要的是,支架应不易裂解、热降解或对加合物的形成发生二聚作用。对于目前的APCI/四极质谱仪,由于同位素的污染使得最小间隔约为4AMU,这样在图谱中可以有大约400个标记。 CMST以模块的方式设计,从而可以用组合化学方法构建标记。在完整的标记寡核苷酸中,有5个“模块”(功能不同的原子基团)。第一个模块是寡核苷酸(ODN),它可以是任意长度和序列,并且带有用于和接头偶联的5’-己胺,所述接头优选是可被光裂解的接头。ODN可以是用于杂交的探针,或是延伸反应、连接反应或酶检测的引物。第二个模块是接头,优选是光不稳定性接头,该接头将标记与寡核苷酸探针或引物相连。在本文详细描述的方法中,光不稳定性接头是邻硝基苄基氨基酸衍生物(概要参见Lebl M.等,“分子多样性参

199

1

1

98809047.3说 明 书 第187/205页

照物的动态数据库”,网址为http://www.5z.com.)。第三模块是电离增强子。该模块是支架,CMST在其上合成,该支架所提供的功能通常对所用电离方法的类型(即APCI(正离子或负离子模式)、电喷雾、MALDI等)是特异性的。第四模块是总质量调节子,可以通过该模块使质量以200-500amu的幅度增加。该模块可以使可变重量调节子重复使用。第五模块是可变重量调节子,也称为可变质量单位(VMU)。可变重量调节子是加入到标记支架上的化学侧臂。这些可变重量调节子可以精细调整CMST的重量。标记的重量间隔至少4amu以避免由于同位素污染引起的图谱的重叠。相同的VMU侧臂可以反复用于不同类型的电离支架中。总之,电离模块和可变质量调节子是用来提供在MSD中的可预测行为,光不稳定性接头的光裂解是迅速的(以下将要描述),CMST/寡核苷酸结合物可与PCR和HPLC以及检测方式中的其它操作相容。

标记的详细合成路线如下并见图22。CMST的合成首先是将光敏感性ANP接头(3-氨基-3-(2-硝基苯基)丙酸,(1))酯化,以84%的收率得到乙酯盐酸盐(2)。该方法的一个重要步骤是将(2)酶转化生成单一异构体形式的乙酯。将乙酯盐酸盐碱化成游离的胺并浓缩后,将油状残余物加入pH7的磷酸盐缓冲液中并用2N盐酸调至中性pH。以磷酸盐缓冲液浆液的形式加入Amano PS酯酶。反应结束后,用碱处理除去水解的ANP副产物(4),回收得到单一的异构体乙酯(3,>99%e.e.)(收率92%)。

将(3)与BOC-e-alloc-赖氨酸(5)用EDAC和HOBT偶联,以91%的收率得到被保护的ANP赖氨酸(6)。用TFA除去BOC得到白色固体状氨基-e-alloc-赖氨酸ANP酯(7)。用EDAC和三乙胺将甲基4-哌啶酸盐酸盐与7偶联,生成粗品alloc-保护的核心结构(8),将其用二乙胺、三苯膦和乙酸钯在50℃下脱保护。将形成的核心结构(9)从反应混合物中析出结晶,过滤回收得到黄色固体,收率95%。 用HATU和N-甲基吗啉将各种羧酸,称为可变质量单位(VMU),与(9)偶联。一组VMU用来提供质量的标记和4a.m.u.的间隔,以避

200

98809047.3说 明 书 第188/205页

免同位素污染。在选择靶质量的具体VMU时,使用以下排除标准:1)与合成顺序不相容的官能团(例如酯);2)具有多种同位素的元素(例如Cl、Br、S);3)可能会导致竞争性光过程的官能团(碘化物、酰基-和芳基-苯酮);4)外消旋的酸和5)是否可以从供销商处得到。 经柱色谱纯化后,以各种收率回收得到CMST乙酯(10)。将(10)用氢氧化钠碱水解,以定量收率得到CMST酸(11)。最后的步骤是活化酯的形成,该步骤用四氟苯酚三氟乙酸酯和Hunnich碱来完成,以各种收率得到CMST TFP酯(12)。

通常可以很方便地将标记连接到寡核苷酸的5’-末端上,从而3’-羟基可以在聚合酶链反应中延伸或者可用于其它酶修饰反应。同样,当按照本申请的描述直接用作探针时,优选将标记连接到寡核苷酸探针的5’-末端上。可以按照Lukhtanov等,“带有共轭的二氢吡咯并吲哚寡肽的寡脱氧核糖核苷酸:制备和杂交特性”,Bioconjug Chem 6(4):418-26,6月-8月,1995描述的准则从CMST和寡核苷酸制备标记的寡核苷酸。                      实施例22

将PHRED光裂解装置安装在HPLC和质谱仪之间或在自动注射器和MSD之间。“PHRED”代表用于增强检测的光化学反应器(Photochmical Reactor for Enhanced Detection),可从AuraIndustries,Staten Island,NY得到(同时带有254nm和366nm的灯泡,使用254nm的灯泡)。内联装置优选置于分离装置(例如HPLC或凝胶)和检测器之间。界面优选具有如下特性:能够以预定的时间间隔收集DNA片段,浓缩DNA片段,从电解缓冲液和环境中取出DNA片段,从DNA片段上裂解掉MW鉴定子,将MW鉴定子与DNA片段分离,弃去DNA片段,将标记置于挥发性溶液中,挥发并离子化标记从而将标记引入到质谱仪中。

光裂解装置的适宜结构是300cm长,8瓦、UV杀菌灯(G8T50)(发射光在366nm左右),在该灯下放置有80l内径为0.01英寸的tefzel

201

98809047.3说 明 书 第1/205页

管状线圈。通常适宜的流速为800/分钟。优选可与APCI/MS兼容并且仅含低浓度的乙腈和缓冲剂如Tris-HCl的溶液组合物。采用该结构,在电离步骤前无需将DNA与标记分离。光不稳定性接头在该条件下裂解非常迅速。APCI室的热源有助于光不稳定性接头的裂解。 通过改变UV光源下的tefzel管状线圈的长度并保持流速恒定,在UV光源下的滞留时间可以在0.75-6秒之间改变。测定均连接了一种寡核苷酸序列(20聚体,M13正向测序引物)的6个标记的汇集物的反应因子(“流动注射分析(FIA)”中每摩尔注射到流体中的标记所产生的积分离子电流)。反应因子是电离、离子引入到真空室中及随后MSD检测的效率的综合结果。汇集物中的每一标记的浓度为100fmol/μl。稀释剂为浓度为1μg/ml的tRNA(BoehringerMannheim)在HPLC级水中的溶液。在表3中,列出了相对于最长的接触时间(6秒)所观察到每个标记的反应因子和信号百分比。结果表明标记迅速地从连接的寡核苷酸上裂解下来(不到2秒)。在1.9-6秒的时间范围内,对6个不同的标记ODN所观察到的反应因子降低很小。在最短的接触时间(0.75秒)时,所观察到的反应因子降低高达25%。 表3

标记分子量447455479503507511

10ul4300 81%4900 92%3600 75%4600 74%5200 85%4100 78%

25ul4400 83%5200 98%4100 85%5700 92%5400 88%5100 98%

50ul5300 100%00 120%4900 102%6700 108%6500 104%5500 105%

80ul5300 100%5300 100%4800 100%6200 100%6100 100%5200 100%

当灯在光裂解装置中时,六种标记的反应因子降低约40%(数据未给出)。还发现光不稳定接头对热不稳定,当气化温度为450℃时,标记在APC电离步骤中明显发生裂解。

202

98809047.3说 明 书 第190/205页

                     实施例23               总标记行为和相对稳定性

设计标记以提供不会裂解成子离子或形成加合物的单一母离子。测定一池43个均连接了一种寡核苷酸序列(20聚体,M13序列)的标记的反应。池中每一标记的浓度为100fmol/μl(浓度通过将寡核苷酸/标记储备液乘以稀释因子测定,所述寡核苷酸/标记储备液在260nm下由光谱法测得)。不对标记在260nm有吸收进行校正。稀释剂为浓度为1μg/ml的tRNA(Boehringer Mannheim)在HPLC级水中的溶液。将池于黑暗中保存在4℃下。CMST标记的寡核苷酸可以在正常的实验室光照条件下处理而不会发生可测定的降解。 在分析前,从储备液中取出55μl等分试样置于200μl聚丙烯自动取样瓶中并旋盖密封。用HPLC HP1100 ALS从池中取样注射5次,每次5μl,注射稀释剂3次,每次5μl。APCI-MS室的参数如下:雾化器压力为20PSI,汽化器温度为450℃,干燥气流为3L/分钟,干燥气体温度为350℃,电晕电流为4μA,碎片器(fragmentor)电压125V,增益设置在1,峰宽为0.07分钟。流速为0.8ml/分钟,光裂解装置的“死空间”为80μl,(0.01”ID Tefzel)。光裂解装置的灯在366nm下工作。通过从TIC中提取SIM离子对各标记进行定量。在如下参数下对峰进行积分:斜率灵敏度2500,最小峰面积800,最小峰高100,峰宽0.15,肩峰设置在“关”。记录各标记在一次实验中所有5次注射的峰面积并计算平均面积以及标准偏差和变异系数。并计算一天、两天时间和3天时间的平均面积、标准偏差和CV。在一天内,不同标记的变异系数在2.0%-9.9%的范围内变化。在三天时间内,不同标记的变异系数在4.0%-9.8%的范围内变化。因此,标记对于存放和混合是稳定的,如表4a、4b和4c所示。

203

98809047.3说 明 书 第191/205页

                      表4a                       1-天

标记分子量447455479503507511

CV@10fmol/注射2.04.06.99.94.14.1

CV@100fmol/注射3.76.57.92.91.84.0

                      表4b                       2-天

标记分子量447455479503507

CV@10fmol/注射3.03.84.81.25.5

CV@100fmol/注射4.18.66.75.68.75.6

5114.5                       表4c

                      3-天

标记分子量447455479503507511

CV@10fmol/注射3.34.05.69.82.03.8

CV@100fmol/注射4.93.96.78.94.86.7

灵敏度和检测下限 目前大量生产的四极质谱仪的灵敏度与基于荧光的测序相当。灵敏度可用对CMST质量的检测下限来表示。我们将检测下限定义为在分析系统基线以上3个标准偏差。对30-离子SIM模式测定43种结合物的汇集物的检测下限。

在tRNA/水稀释剂中制备一组10个、两倍稀释液,使得每次注

204

98809047.3说 明 书 第192/205页

射500,250,125,62.5,31.2,15.6,7.8,3.9,1.9和0.9fmol物质(5-10μl)。在上述条件下得到30-离子SIM模式的数据。各标记的LLD如表5所示。           表5

   对43种CMST的检测下限

标记分子量367371375379383387391395403407411415419423427431439443447459463467471475479483487

LLD30301515301515158151588815884488824288

LLD信号19701707131812258513011554196017842266228513621260153016071606279715761144188111791625109416262615281556

205

98809047.3说 明 书 第193/205页

标记分子量495499503507511515519523527531535539543

LLD15154888815888415

LLD信号1414651208184314531276104216908151521127616511076

在寡核苷酸的光裂解步骤之后,该组标记的LLD约为4-30fmol/注射:(30×10100×10

-15

-15

mol@500MW-->5×10

-11

克-->500微微克标记,

-8

mole×330×400nt×2=3×10克=30纳克的400nt

双链PCR产物)。因此,假设平均25μl PCR反应液含有300ng双链PCR产物,则该产物的约1/10即可用于产生在统计学上高于测量基线的信号。为了进行比较,每条ABI 377测序仪上的泳道使用约100-200ng DNA。

标记系统的检测下限影响在一次注射时可以达到的多路复用水平。目前,当每次注射使用高达10μg PCR产物时,我们未发现任何与测量过程有关的问题。该数字意味着使用本发明的标记系统可以同时进行10,000/30或约300个反应。因此,对于HP MSD1100,多路复用水平基本与可以在四极MS光谱中放置的标记相同。

206

98809047.3说 明 书 第194/205页

标记干扰

就多路复用大量本发明的CMST的反应(反映电离程度、碎裂或降解程度、加合物形成等的可测离子电流)而言,干扰很小或没有干扰。标记的多路复用不影响各标记的反应,因此多路复用不影响电离或总的离子电流。

作为注射体积函数的反应因子

如上所述,对一池43种结合物进行测定以确定作为注射体积函数的反应因子。以5、10、20、50和100μl的体积测定每次注射50fmol和每次注射500fmol。APCI-MS参数与标记稳定性实验中所用的相同。表4中所示的数值为每一测定体积5次重复注射的平均值。在5μl和10μl体积之间RF没有降低。在20μl注射体积时,RF为5μl体积的90-97%。当测定50μl体积时,RF为5μl体积的54-75%。当使用100μl的注射体积时,没有可检测的信号。                       实施例24                   P4502D6多态检测

本文所示的CMST技术平台可用于测定CYP2D6的多态,该多态与异喹胍4-羟化酶的代谢有关。该P450细胞色素在30种以上的药物和外源性生物化合物的代谢中是非常重要的。CYP2D6(P450-2D6)被认为与大约25%目前使用的处方药的代谢有关。CYP2D6也称作异喹胍/鹰爪豆碱羟化酶。Sache,Am.J.Human Genetics,60:284-295,1997估计高达10%的高加索人由于在两个等位基因且失活突变或基因完全缺失而是不良代谢者。除不良代谢者外,还有宽范围的CYP2D6活性。选择用于研究的突变包括C188T、G212A、delT1795、G1846T/A、G1934A、delA2637、C2938T和G4268C。按照先前的记载通过凝胶电泳检测RFLP(参见Gough等,自然347:773-776,1990)。用于RFLP的引物相当于Sachse等(Am.J.Hum.Genet.60:

207

98809047.3说 明 书 第195/205页

284-295,1997)所用的引物。用于测序的引物相当于Meyer等,Pharmacogenetics 5:373-384,1995所用的引物。

基于CMST的分析的原理是将扩增的CYP2D6外显子的一条链固定在固相(如磁性颗粒)上,杂交寡核苷酸探针,洗除未杂交的物质,洗脱杂交的探针然后通过质谱仪检测质谱标记(将标记从探针上裂解掉以后)。

扩增条件如下:使用2D6基因侧翼的引物(Sachse等,Am.J.Hum.Genet.60:284-295,1997)扩增含有所有相关基因序列的4,681bp基因组DNA片段。PCR反应液由1X Expand HF缓冲液、1.5mMMgCl2、200μM dNTP、0.5μM引物P100&P200、0.5%甲酰胺、100nggDNA和1.1U Expand高保真度酶混合物(Boehringer Mannheim)组成。热循环条件如下:94℃3分钟;94℃30秒,62℃30秒,68℃4分钟,10个循环;94℃30秒,62℃30秒,68℃4分钟+20秒/循环,20个循环;68℃10分钟。在溴化乙锭染色的1.0%琼脂糖凝胶上肉眼观察产物。

检测方案如下。将链霉抗生物素磁颗粒(Promega Magnesphere,80pmol生物素/100μg颗粒的结合能力)用低盐洗涤和结合缓冲液(LSWBB,100mM NaCl,1mM EDTA,10mM Tris,pH7.5)洗涤,然后以2000μg/ml的浓度重悬在高盐洗涤和结合缓冲液(HSWBB,2MNaCl,1mM EDTA,10mM Tris,pH7.5)中。在21℃,将生物素化的PCR产物与链霉抗生物素颗粒一起保温2小时,同时持续旋转混合。将颗粒用200μl HSWBB洗涤两次,用200μl LSWBB洗涤一次。然后在21℃将结合的PCR扩增子用50μl 0.1N NaOH处理10分钟使其变性。然后将颗粒用50μl 0.1N NaOH洗涤一次,用200μl LSWBB洗涤一次。然后将颗粒结合的扩增子与拥有不同质量标记的等摩尔野生型(wt)和突变(mt)探针杂交。将50pmol相应的探针放在200μl 2mGuSCN,5mM EDTA和10mM Tris pH7.5的溶液中,然后将50μl杂交溶液与颗粒混合。在21℃持续旋转混合下杂交1小时。将颗粒用LSWBB洗涤5次,第二次洗涤后更换管。用20μl 0.1N NaOH处理颗

208

TM

98809047.3说 明 书 第196/205页

粒并用9μl 0.1N NaOH洗涤一次,从而从颗粒中洗脱杂交探针。然后,用3μl 1M乙酸中和溶液,再将5μl该溶液注射到质谱仪(配有真空脱气器、二元泵、自动取样器和二极管阵列检测器的HP 1100系列LC/MS)中。将质谱仪与APCI源选项一起使用。将HP LC/MSDChemstation软件用于系统控制,数据获取和数据分析建立在带有Windows NT工作站4.0版操作系统的HP vectra XA上)。进入MS中的流体由50%乙腈的超纯水溶液组成,流速为800μl/分钟。光化学裂解装置由254nm低压汞灯、UV透明反应器线圈和灯架组成(AuraIndustries)。

代表性的结果列于表6。                      表6

个体   外显子  mAU(wt)    mAU(mt)    CMSTcall  RFLPcall1362 PF 13   4     0          190,000    M/M       M/M1362 PM 14   4     152,000    0          W/W       W/W1362 MF 15   4     149,000    53,000     W/M       W/M1377 C1 19   6     0          271,000    M/M       M/M1377 C2 20   6     104,000    88,000     W/M       W/M1377 C3 21   6     290,000    0          W/W       W/W1377 C1 19   9     0          74,000     M/M       M/M1377 C2 20   9     38,000     41,000     W/M       W/M1377 C3 21   9     149,000    0          W/W       W/W  对照             0          0          无       无                       实施例25

           用CMST标记的ODN进行基因表达监测

在终体积22μl中用Superscript II反转录酶和oligodT引物,按照制造商(Life Technologiesl Gaithersburg,MD)的说明反转录来自A549人细胞系的总RNA(1-2μg)。用Taq聚合酶链反应(PCR)扩增跨内外显子边界的细胞程序死亡相关人DAD-1基因编码区的75bp区;95℃开始变性(5分钟),然后进行25-60个循环(在45℃退火15秒,在95℃变性5秒)。PCR反应物(20-200μl)含0.5μM DAD-1

209

98809047.3说 明 书 第197/205页

反向引物(5’-生物素-CCA GGA AAT TCA AAG AGT GA-3’),0.0125μM或0.5μM DAD-1磷酸化正向引物(5’-TTG GCT GAA TCA TTC TCA

TT-3’),7×10-1.2×10分子的内部标准(5’-CC AGG AAA TTC AAA GAGTGA ACA TTC TTT TTG TGT CG-3’),1μl A549 cDNA或8×10-×10

4

11

2

7

分子的WT模拟物(5’-CCA GGA AAT TCA AAG AGT GAA CAT TCT TTT AGTCTC CTA CTC CTC AAT TAA GTA AAT GAG AAT GAT TCA GCC AA-3’),0.8 U Taq聚合酶,0.2mM dATP,0.2mM dCTP,0.2mM dGTP,0.2mM dTTP,1.5mM MgCl2,50mM KCl和10mM Tris-HCl pH8.3。 通过不对称扩增条件(上述)或在18mM Tris-HCl pH9.5,1.8mMMgCl2,28mM KCl中用2.5Uλ核酸外切酶(Boehringher Mannheim;Indianapolis,IN)消化15分钟(37℃)得到单链扩增产物(50μl)。将消化的扩增子或不对称PCR反应物在70℃放置5分钟,大致冷却(室温),然后调整到2.1M异硫氰酸胍,50mM Tris-HCl pH7.5,0.1%sarkosyl,1μg/ml tRNA,5μg/ml WT 394探针(5’-394 MW CMST标记-TTG AGG AGT AGG AGA CTA AAA-3’),5μg/ml IS 390探针(5’-390MW CMST标记-TTGACGACTACGACACAAAAA-3’)。

将杂交反应物保温10分钟(室温),然后转移到含7μl 286μg/mlAvidin-DN(Vector;Burlingame,CA)和0.7μg/ml tRNA的30K MWCO旋转过滤器(Millipore Corp.,Bedford,MA)中。将旋转过滤器保温5-10分钟(RT)并离心(4000xg,10分钟)。将旋转过滤器用400μl冷HPLC级dH2O洗涤两次,然后离心(4000xg,10分钟)。将25μl1μg/ml tRNA加至旋转过滤器中以洗脱残留的杂交物。将50%乙腈中的25μl残留物通过光解装置注射进入HP质谱仪(APCI阳离子模式)。对分子量为390和394的标记进行单离子测量,结果用峰面积表示。390/394标记信号的比与从内部标准或A549 DAD-1 cDNA或WT模拟物产生的扩增子的量成正比。A549总RNA中RNA分子的未知量或WT模拟物的量可以从标准曲线计算,所述标准曲线是注入的内部标准分子数与390/394标记信号比的log/log图。未知数是当y=0时的X的数值。或者,当比值在0.3-3之间时,未知数=390/394的

210

98809047.3说 明 书 第198/205页

比×注入的内部标准分子的数。 结果如图23所示。

                      实施例26                   单核苷酸延伸分析

RNA制备:用Promega(WI)的RNA分离试剂盒从Jurkat细胞(指数生长期的1×10个细胞)分离并制备总RNA。将RNA分成两份贮藏:(1)将焦碳酸二乙酯处理过的ddH2O中的储备液于-20℃贮存,和(2)100%H2O中的悬浮液长期贮藏。

反转录:按Ausubel等(Ausubel等,《分子生物学最新方法》,1991,Greene Publishing Associates/Wiley-Interscience,NY,NY)所述完成总RNA的poly(dT)引发的反转录,不同的是将反应扩大为用1μg总RNA。将20-50单位反转录酶(Promega)用10%甘油、10mM KPO4 pH7.4,0.2%Triton X-100和2mM DTT稀释10倍,然后在加入至反应前在冰上放置30分钟。用在20μl反应液中的10mMTris-HCl pH8.3,50mM KCl,M MgCl2,1mM dNTP,2U/μl RNAsin(Gibco-BRL),0.1μM寡聚体和0.125 U/μl M-MLV反转录酶(Gibco-BRL)反转录的1μg Jurkat RNA完成附图和表中所述GADPH和其它对照基因的基因特异性反转录。在42℃将反应液保温15分钟,在95℃加热5分钟失活,然后用10mM Tris HCl pH8.3,1mMNH4Cl,1.5M MgCl2,100mM KCl、0.125mM NTP,10ng/ml相应的寡核苷酸引物和0.75单位TAQ聚合酶(Gibco-BRL)的母混合物稀释至100μl准备用于PCR扩增。

PCR:用跨已知内含子/外显子边界的基因特异性引物(见下文表)进行每一基因的PCR。所有PCR均在含(10mM Tris HCl pH8.3,1mMNH4Cl,1.5M MgCl2,100mM KCl)、0.125mM NTP,10ng/ml相应的寡核苷酸引物和0.75单位TAQ聚合酶(Gibco-BRL)的20μl溶液中完成。循环参数是94℃预热5分钟,然后94℃变性1分钟、55℃退火2分钟、72℃延伸30秒-1分钟,最后在72℃延伸10分钟。

211

9

98809047.3说 明 书 第199/205页

扩增数一般为30-45个循环。

模板的纯化:按Zhen和Swank(Zhen and Swank,BioTechniques,14(6):4-8,1993)所述,凝胶纯化PCR产物。用在0.04M Tris-乙酸,0.001 M EDTA(1x TEA)缓冲液中跑电泳的1%琼脂糖凝胶分离PCR产物,然后用溴化乙锭染色,并用UV光肉眼观察。在所研究条带前沿切一槽,用50-200μl 1x TAE缓冲液中的10%PEG填充。继续电泳直到条带完全进入槽。然后取出内含物并用酚、氯仿抽提,然后用0.1体积7.5M乙酸铵和2.5体积100%EtOH沉淀。将样品用75%EtOH洗涤,然后在室温下稍微干燥。通过在1xTBE缓冲液中的1%琼脂糖凝胶上电泳少量样品,用溴化乙锭染色并与已知标准物比较,来确定产率。

在含约100ng扩增DNA片段、1μM SNuPE引物、2单位Taq聚合酶和1μl适宜dNTP的50μl溶液中完成每个SNuPE反应。在该类检测中,所有dNTP均不标记。所用的缓冲液是10mM Tris-HCl(pH8.3),50mM KCl,5mM MgCl2和0.001%(wt/vol)明胶。将样品经由95℃变性2分钟、60℃退火2分钟和72℃引物延伸2分钟组成的循环。下面描述每个家族的SNUPE引物的序列。

引物延伸:按Singer-Sam等(Singer-Sam等,PCR方法与应用1:160-163,1992)所述完成单核苷酸引物延伸,不同的是在每种反应中使用1mM Mg++,0.1μM引物和0.05μM每种dNTP。上述的每种引物延伸后,加入1/5体积的上样染料(80%甲酰胺、0.1%溴酚蓝,0.1%二甲苯腈蓝,2mM EDTA),将整个样品在15%变性聚丙烯酰胺凝胶上电泳。将凝胶用10%甘油、10%甲醇、10%冰醋酸持续晃动下固定,然后用10%甘油洗涤。然后将凝胶在55℃干燥3-5小时。 Rychlik(Rychlik,BioTechniques 18:84-90,1995)描述了本试验所描述的引物。引物可以合成,或者作为凝胶过滤级引物从Midland Certified Reagent Company(Midland Texas)得到。扩增是以TAQ DNA聚合酶为基础(10mM Tris-HCl pH8.3,1.5mM MgCl2,50mM KCl)或者以Pfu DNA聚合酶为基础(20mM Tris-HCl pH8.3,

212

98809047.3说 明 书 第200/205页

2.0mM MgCl2,10mM KCl,10mM(NH4)2SO4,0.1%Triton X-100,0.1mg/ml牛血清白蛋白)的。在反应液中,总三磷酸核苷(NTP)的浓度为0.8mM,引物浓度是200nM(除非特别说明),模板的量是每20μl反应液0.25ngλ噬菌体DNA。循环参数是94℃预热5分钟,随后94℃变性1分钟、55℃退火2分钟、72℃延伸30秒-1分钟,最后在72℃延伸10分钟。通常扩增30-45个循环。

选择λ噬菌体基因组(GenBank Accession#J02459)中的两个区域作为扩增的引发位点。5’-引物有稳定的GC富集的3’末端:选择3’引物以便产生381bp产物。5’正向引物是H17:5’-GAACGAAAACCCCCCGC。3’反向引物是RP17:GATCGCCCCCAAAACACATA。 然后检测扩增产物是否在位置31245存在多态现象。在四个单核苷酸延伸检测中使用下列引物;SNE17:5’-GAACGAAAACCCCCCGC。然后按上述完成四种单核苷酸延伸检测。所有反应物集中后,将5μl集中的物质不用进一步纯化即注射到HPLC柱(SeraSep,San Jose,CA)上。

用自动HPLC仪器(Rainin,Emeryville,CA.,或HewlettPackard,Palo Alto,CA)完成HPLC。将注射至HPLC前在95℃变性了3分钟的未纯化SNEA产物用1.8%/分钟的线性乙腈(ACN,J.T.Baker,NJ)梯度以0.9ml/分钟的流速洗脱。根据SNEA产物的大小调整起点和终点。成功分辨SNEA分子所需的温度是50℃。然后将HPLC洗脱液加至质谱仪(Hewlett Packard,Palo Alto,CA)中以检测标记,结果列于表7。表7

标记引物SNE17-487SNE17-496SNE17-503SNE17-555

ddNTP类型ddATPddGTPddCTPddTTP

保留时间2.5分钟2.5分钟4.6分钟2.5分钟

延伸与否否否是否

213

98809047.3说 明 书 第201/205页

因此,结果表明在4.6分钟的保留时间检测到质谱标记(CMST),这说明SNE17引物是由一个碱基(ddCTP)延伸的,因此,在31245位的多态现象在这种情况下是“G”。SNE17-487、SNE17-496和SNE17-555标记的引物不被延伸,而且其在HPLC上的保留时间分别为2.5分钟。

                      实施例27

            标记分子合成的亚磷酰胺化学法氨己基为末端的标记的制备

如图26所示,用TFP方法制备纯净的氨己基为末端的标记(8)。TFP酯通过将标记166的锂盐(9)与过量的TFP-TFA和Hunigs碱在DMF中反应制得。然后,将TFP酯的二氯甲烷溶液用6-氨基己醇处理。立即形成(8)的沉淀,将其通过过滤分离。标记亚磷酰胺的制备

将氨己基为末端的标记(5)与氯代亚磷酰胺反应,生成所需的亚磷酰胺(17),质谱分析未检测到膦酸酯。

用氘代甲醇使过量的phosphytilating试剂猝灭(通常使用H3-甲醇,但在该情况下使用氘代甲醇可以清楚地鉴定猝灭产物的来源),生成(18)。该物质会在随后的水处理中残留下来,由于该物质本身即是亚磷酰胺,它有可能干扰随后的反应。亚磷酰胺与吸附在聚合物上的胸腺嘧啶的反应

将胸腺嘧啶连接在带有一定数量孔的玻璃珠上,所述玻璃珠包

214

1

98809047.3说 明 书 第202/205页

-6

含在塑料筒内。所用筒含有1000nM(1×10摩尔)吸附的胸腺嘧啶。碱基的5’-羟基以二甲氧基三苯甲基醚形式进行保护,在与亚磷酰胺反应前用3%三氯乙酸的二氯甲烷溶液脱除保护(图27)。与亚磷酰胺反应后,将中间体亚磷酸三酯(19)氧化成更稳定的磷酸三酯(20)。用氨除去氰乙基保护基并同时从固相载体上裂解,得到标记的胸腺嘧啶(21)。

以此顺序使用将从亚磷酰胺制得的粗品并将从载体上裂解下来的物质通过质谱仪进行分析。表8给出了以正离子模式观察到的主要离子及其归属。

                      表8

似乎在所用条件下磷酸酯键易于断裂。以负离子模式进行的分析显示在338amu有一峰,相当于化合物(22),该峰是由猝灭反应的产物(18)(图28)产生的,该产物是粗品中的主要污染物。 可以通过硅胶色谱将标记-亚磷酰胺(17)与非极性污染物(18)分离(10%甲醇/%二氯甲烷/1%三乙胺)并得到115mg(17)。将该物

215

98809047.3说 明 书 第203/205页

质用于反应循环得到(21),(21)在质谱中以其裂解产物(5)被检测到(粗品的HPLC分析表明不存在(5),因此质谱中位于711amu的峰一定是由于所需产物(21)在仪器中裂解产生的)。同时还存在未反应的胸腺嘧啶,表明反应未进行完全。还使该物质流过UV裂解流动系统并通过质谱法检测光裂解产物(23)。

因此,可以制备质谱标记亚磷酰胺并将其纯化并与聚合物结合底物反应,然后可对其进行氧化、脱保护以及从载体上裂解以生成标记的碱基。

1.“寡核苷酸合成,一种实用的途径”M.J.Gait编,IRL Press1990。

2.R.T Pon,四面体通讯(Tetrahedron lett),1991,1715。 3.可从Glen Research以目录号10-1953-xx得到。 4.“肽合成原理”M.Bodansky,Springer-Verlag 1984。 5.A.J Cocuzza,四面体通讯,19,6287。

6.N.N.Poluskin,B.Chen,L.W.Anderson和J.S Cohen,有机化学杂志,1993,58,4606。 参考文献

Adams,S.P.,Kayka.K.S.,Wykes,E.J.,Holder,S.B.,和Galluppi,G.R.(1983)。美国化学会志105,661-663。

216

98809047.3说 明 书 第204/205页

Andrus,A.,Efcavitch,J.W.,McBride,L.T.,和Giusti,B.(1988)。四面体通讯29,861-8。

Beaucage,S.L.,和Caruthers,M.H.(1981)。四面体通讯22,1859-1862。

Caruthers.M.H.,Beaucage,S.L.,Efcavitch.J.W.,Fisher,E.F.,Matteuci,M.D,.和Stabinsky(1980)。Nucleic Acids Res.Symp.Ser.7,215-223。

Ferrance,I.K.,Eadie,J.S.,和Ivarie,R.,(19)。核酸研究17,1232-1245。

Froehler,B.C.,Ng.P.G.,和Matteucci,M.D.(1986a)。核酸研究14,5399-5407。

Froehler,B.C.,和Matteucci,M.D.(1986b)。四面体通讯27,469-472。

Froehler,B.C.(1986c)。四面体通讯27,5575-5578。 Froehler,B.C.,Ng,P.G.和Matteuccj,M.D.(1988)。核酸研究16,4831-4839。

Gaffney,B.L.和Jones,R.A.(1988)。四面体通讯29,2619-2622。

Garegg,P.J.,Regberg,T.,Stawinski,J.和Stromberg,R.(1985)。Chem.Scripta 25,280-282。

Garegg,P.J.,Regberg,T.,Stawinski,J.和Stromberg,R.(1986a)。Chem.Scripta 26,59-62。

Garegg,P.J.,Lidh,I.,Regberg,T.,Stawinski,J.和Stromberg,R.(1986b)。四面体通讯27,4051-4054。

Hall,R.H.,Todd,A.R.,和Webb,R.F.(1957)。化学会志3291-3296。

Letsinger,R.L.,和Mahadevan,V.J.(1965)。美国化学会志。87,3526-3227。

Letsinger,R.L.,Finnan.J.L.,Heavner,G.A.和Lunsford,

217

98809047.3说 明 书 第205/205页

W.B.(1975)。美国化学会志97,3278。

Letsinger,R.L.,Groody,E.P.,和Tanaka,T.(1982)。美国化学会志104,6805-6806。

McBride,L.J.,和Caruthers,M.H.(1983)。四面体通讯24,245-248。

Merrifield,R.B.(1963)美国化学会志85,2149-2154。 Seliger,H.和Roesch,R.(1990)。DNA和细胞生物学(DNA andCell Biol.,9,691-696。

Stein,C.A.,Iversen,C.A.,Subashinge,C.,Cohen和Zon,G.(1990)。分析生物化学188,11-16。

从上文可以理解到,虽然本文已为举例说明的目的描述了本发明的特定实施方案,但可在不背离本发明的精神和范围的前提下作出各种改动。

218

98809047.3

说 明 书 附 图

第1/31页

图1

219

98809047.3说 明 书 附 图 第2/31页

图2

220

98809047.3说 明 书 附 图 第3/31页

图3

221

98809047.3说 明 书 附 图 第4/31页

图4

222

98809047.3说 明 书 附 图 第5/31页

图5

223

98809047.3说 明 书 附 图 第6/31页

图6

224

98809047.3说 明 书 附 图 第7/31页

图7

225

98809047.3说 明 书 附 图 第8/31页

图8

226

98809047.3说 明 书 附 图 第9/31页

图9

227

98809047.3说 明 书 附 图 第10/31页

图10

228

98809047.3说 明 书 附 图 第11/31页

229

98809047.3说 明 书 附 图 第12/31页

图13可变重量重量范围质谱灵敏可被光裂解5′-氨基己基为 部分调节部分 度增强子的接头末端的寡

核苷酸

图14A

230

98809047.3说 明 书 附 图 第13/31页

图14B

图14C

231

98809047.3说 明 书 附 图 第14/31页

图14D

图14E

232

98809047.3说 明 书 附 图 第15/31页

图14F

图14G

233

98809047.3说 明 书 附 图 第16/31页

图14H

图14I

234

98809047.3说 明 书 附 图 第17/31页

图15

图16

图17检测系统

235

98809047.3说 明 书 附 图 第18/31页

图18检测系统

236

98809047.3说 明 书 附 图 第19/31页

图19B

237

98809047.3图20A

238

说 明 书 附 图 第20/31页

98809047.3说 明 书 附 图 第21/31页

239

98809047.3说 明 书 附 图 第22/31页

图21

240

98809047.3说 明 书 附 图 第23/31页

图22A

241

98809047.3说 明 书 附 图 第24/31页

图22B

242

98809047.3说 明 书 附 图 第25/31页

图22C

243

98809047.3说 明 书 附 图 第26/31页

图23

244

98809047.3说 明 书 附 图 第27/31页

图24

245

98809047.3说 明 书 附 图 第28/31页

图25

246

98809047.3说 明 书 附 图 第29/31页

图26

247

98809047.3说 明 书 附 图 第30/31页

图27

248

98809047.3说 明 书 附 图 第31/31页

图28

249

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo9.cn 版权所有 赣ICP备2023008801号-1

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务