This function calculates pairwise distances for all
combinations of a DNAStringSet
.
dnastring2dist(
dna,
model = "IUPAC",
threads = 1,
symmetric = TRUE,
score = NULL,
mask = NULL,
region = NULL,
...
)
DNAStringSet
[mandatory]
specify model either "IUPAC" or any model from
ape::dist.dna
[default: IUPAC]
number of parallel threads [default: 1]
symmetric score matrix [default: TRUE]
score matrix
use score matrix to calculate
distances [default: NULL]
IRanges
object indicating masked sites
[default: NULL]
IRanges
object indicating region to use for dist
calculation. Default is null, meaning all sites are used [default: NULL]
other ape::dist.dna
parameters
(see dist.dna
)
A data.frame of pairwise distance values distSTRING
and
sites used sitesUsed
## load example sequence data
data("hiv", package="MSA2dist")
#dnastring2dist(hiv, model="IUPAC")
hiv |> dnastring2dist(model="IUPAC")
#>
Computing: [========================================] 100% (done)
#> $distSTRING
#> U68496 U68497 U68498 U68499 U68500 U68501
#> U68496 0.00000000 0.03296703 0.07326007 0.07692308 0.10256410 0.09523810
#> U68497 0.03296703 0.00000000 0.08791209 0.08424908 0.10989011 0.10989011
#> U68498 0.07326007 0.08791209 0.00000000 0.05128205 0.06959707 0.07326007
#> U68499 0.07692308 0.08424908 0.05128205 0.00000000 0.04029304 0.09523810
#> U68500 0.10256410 0.10989011 0.06959707 0.04029304 0.00000000 0.11355311
#> U68501 0.09523810 0.10989011 0.07326007 0.09523810 0.11355311 0.00000000
#> U68502 0.13553114 0.14285714 0.10256410 0.10622711 0.13186813 0.10622711
#> U68503 0.11721612 0.11721612 0.09890110 0.10622711 0.11721612 0.11355311
#> U68504 0.10989011 0.12454212 0.09157509 0.09157509 0.11355311 0.09890110
#> U68505 0.10989011 0.11721612 0.08424908 0.08791209 0.10989011 0.09890110
#> U68506 0.10622711 0.12454212 0.10256410 0.10256410 0.12087912 0.10256410
#> U68507 0.12454212 0.13919414 0.08424908 0.09523810 0.11355311 0.10622711
#> U68508 0.15018315 0.15018315 0.12454212 0.11355311 0.11355311 0.12454212
#> U68502 U68503 U68504 U68505 U68506 U68507
#> U68496 0.1355311 0.1172161 0.10989011 0.10989011 0.10622711 0.12454212
#> U68497 0.1428571 0.1172161 0.12454212 0.11721612 0.12454212 0.13919414
#> U68498 0.1025641 0.0989011 0.09157509 0.08424908 0.10256410 0.08424908
#> U68499 0.1062271 0.1062271 0.09157509 0.08791209 0.10256410 0.09523810
#> U68500 0.1318681 0.1172161 0.11355311 0.10989011 0.12087912 0.11355311
#> U68501 0.1062271 0.1135531 0.09890110 0.09890110 0.10256410 0.10622711
#> U68502 0.0000000 0.1208791 0.10622711 0.09890110 0.12087912 0.10622711
#> U68503 0.1208791 0.0000000 0.10989011 0.10256410 0.12087912 0.10256410
#> U68504 0.1062271 0.1098901 0.00000000 0.02930403 0.02930403 0.05494505
#> U68505 0.0989011 0.1025641 0.02930403 0.00000000 0.05128205 0.04029304
#> U68506 0.1208791 0.1208791 0.02930403 0.05128205 0.00000000 0.05494505
#> U68507 0.1062271 0.1025641 0.05494505 0.04029304 0.05494505 0.00000000
#> U68508 0.1282051 0.1172161 0.10256410 0.09157509 0.11355311 0.09157509
#> U68508
#> U68496 0.15018315
#> U68497 0.15018315
#> U68498 0.12454212
#> U68499 0.11355311
#> U68500 0.11355311
#> U68501 0.12454212
#> U68502 0.12820513
#> U68503 0.11721612
#> U68504 0.10256410
#> U68505 0.09157509
#> U68506 0.11355311
#> U68507 0.09157509
#> U68508 0.00000000
#>
#> $sitesUsed
#> U68496 U68497 U68498 U68499 U68500 U68501 U68502 U68503 U68504 U68505
#> U68496 273 273 273 273 273 273 273 273 273 273
#> U68497 273 273 273 273 273 273 273 273 273 273
#> U68498 273 273 273 273 273 273 273 273 273 273
#> U68499 273 273 273 273 273 273 273 273 273 273
#> U68500 273 273 273 273 273 273 273 273 273 273
#> U68501 273 273 273 273 273 273 273 273 273 273
#> U68502 273 273 273 273 273 273 273 273 273 273
#> U68503 273 273 273 273 273 273 273 273 273 273
#> U68504 273 273 273 273 273 273 273 273 273 273
#> U68505 273 273 273 273 273 273 273 273 273 273
#> U68506 273 273 273 273 273 273 273 273 273 273
#> U68507 273 273 273 273 273 273 273 273 273 273
#> U68508 273 273 273 273 273 273 273 273 273 273
#> U68506 U68507 U68508
#> U68496 273 273 273
#> U68497 273 273 273
#> U68498 273 273 273
#> U68499 273 273 273
#> U68500 273 273 273
#> U68501 273 273 273
#> U68502 273 273 273
#> U68503 273 273 273
#> U68504 273 273 273
#> U68505 273 273 273
#> U68506 273 273 273
#> U68507 273 273 273
#> U68508 273 273 273
#>
#> $regionUsed
#> IRanges object with 1 range and 0 metadata columns:
#> start end width
#> <integer> <integer> <integer>
#> [1] 1 273 273
#>
#dnastring2dist(hiv, model="K80")
hiv |> dnastring2dist(model="K80")
#>
Computing: [========================================] 100% (done)
#> $distSTRING
#> U68496 U68497 U68498 U68499 U68500 U68501
#> U68496 0.00000000 0.03381189 0.07731910 0.08135801 0.11058044 0.1022214
#> U68497 0.03381189 0.00000000 0.09396372 0.08960527 0.11916567 0.1194893
#> U68498 0.07731910 0.09396372 0.00000000 0.05333488 0.07342797 0.0773191
#> U68499 0.08135801 0.08960527 0.05333488 0.00000000 0.04143570 0.1022214
#> U68500 0.11058044 0.11916567 0.07342797 0.04143570 0.00000000 0.1237391
#> U68501 0.10222140 0.11948926 0.07731910 0.10222140 0.12373909 0.0000000
#> U68502 0.15034875 0.15944273 0.11058044 0.11508395 0.14574043 0.1150839
#> U68503 0.12820341 0.12801546 0.10670096 0.11570627 0.12865927 0.1241547
#> U68504 0.11948926 0.13725343 0.09823725 0.09808005 0.12357099 0.1067010
#> U68505 0.11991759 0.12865927 0.09004207 0.09412740 0.11948926 0.1071151
#> U68506 0.11570627 0.13810141 0.11106780 0.11087962 0.13231873 0.1108796
#> U68507 0.13779195 0.15620300 0.08987206 0.10254762 0.12415474 0.1157063
#> U68508 0.16841517 0.16820628 0.13664927 0.12322781 0.12342960 0.1368233
#> U68502 U68503 U68504 U68505 U68506 U68507
#> U68496 0.1503488 0.1282034 0.11948926 0.11991759 0.11570627 0.13779195
#> U68497 0.1594427 0.1280155 0.13725343 0.12865927 0.13810141 0.15620300
#> U68498 0.1105804 0.1067010 0.09823725 0.09004207 0.11106780 0.08987206
#> U68499 0.1150839 0.1157063 0.09808005 0.09412740 0.11087962 0.10254762
#> U68500 0.1457404 0.1286593 0.12357099 0.11948926 0.13231873 0.12415474
#> U68501 0.1150839 0.1241547 0.10670096 0.10711515 0.11087962 0.11570627
#> U68502 0.0000000 0.1329430 0.11492829 0.10653177 0.13216493 0.11479883
#> U68503 0.1329430 0.0000000 0.12044927 0.11207381 0.13380780 0.11238786
#> U68504 0.1149283 0.1204493 0.00000000 0.02991119 0.02989309 0.05716637
#> U68505 0.1065318 0.1120738 0.02991119 0.00000000 0.05318229 0.04147662
#> U68506 0.1321649 0.1338078 0.02989309 0.05318229 0.00000000 0.05724730
#> U68507 0.1147988 0.1123879 0.05716637 0.04147662 0.05724730 0.00000000
#> U68508 0.1408688 0.1282034 0.11029157 0.09766850 0.12313538 0.09767284
#> U68508
#> U68496 0.16841517
#> U68497 0.16820628
#> U68498 0.13664927
#> U68499 0.12322781
#> U68500 0.12342960
#> U68501 0.13682326
#> U68502 0.14086878
#> U68503 0.12820341
#> U68504 0.11029157
#> U68505 0.09766850
#> U68506 0.12313538
#> U68507 0.09767284
#> U68508 0.00000000
#>
#> $sitesUsed
#> U68496 U68497 U68498 U68499 U68500 U68501 U68502 U68503 U68504 U68505
#> U68496 273 273 273 273 273 273 273 273 273 273
#> U68497 273 273 273 273 273 273 273 273 273 273
#> U68498 273 273 273 273 273 273 273 273 273 273
#> U68499 273 273 273 273 273 273 273 273 273 273
#> U68500 273 273 273 273 273 273 273 273 273 273
#> U68501 273 273 273 273 273 273 273 273 273 273
#> U68502 273 273 273 273 273 273 273 273 273 273
#> U68503 273 273 273 273 273 273 273 273 273 273
#> U68504 273 273 273 273 273 273 273 273 273 273
#> U68505 273 273 273 273 273 273 273 273 273 273
#> U68506 273 273 273 273 273 273 273 273 273 273
#> U68507 273 273 273 273 273 273 273 273 273 273
#> U68508 273 273 273 273 273 273 273 273 273 273
#> U68506 U68507 U68508
#> U68496 273 273 273
#> U68497 273 273 273
#> U68498 273 273 273
#> U68499 273 273 273
#> U68500 273 273 273
#> U68501 273 273 273
#> U68502 273 273 273
#> U68503 273 273 273
#> U68504 273 273 273
#> U68505 273 273 273
#> U68506 273 273 273
#> U68507 273 273 273
#> U68508 273 273 273
#>
#> $regionUsed
#> IRanges object with 1 range and 0 metadata columns:
#> start end width
#> <integer> <integer> <integer>
#> [1] 1 273 273
#>
data("woodmouse", package="ape")
#dnastring2dist(dnabin2dnastring(woodmouse), score=iupacMatrix())
woodmouse |> dnabin2dnastring() |> dnastring2dist()
#>
Computing: [========================================] 100% (done)
#> $distSTRING
#> No305 No304 No306 No0906S No0908S No0909S
#> No305 0.00000000 0.016684046 0.013541667 0.018789144 0.016701461 0.016701461
#> No304 0.01668405 0.000000000 0.005208333 0.013555787 0.011470282 0.015641293
#> No306 0.01354167 0.005208333 0.000000000 0.009384776 0.007299270 0.011470282
#> No0906S 0.01878914 0.013555787 0.009384776 0.000000000 0.012486993 0.016649324
#> No0908S 0.01670146 0.011470282 0.007299270 0.012486993 0.000000000 0.014568158
#> No0909S 0.01670146 0.015641293 0.011470282 0.016649324 0.014568158 0.000000000
#> No0910S 0.01774530 0.012513034 0.008342023 0.009365245 0.011446410 0.015608741
#> No0912S 0.01461378 0.013555787 0.009384776 0.014568158 0.012486993 0.010405827
#> No0913S 0.01878914 0.005213764 0.005213764 0.012486993 0.012486993 0.016649324
#> No1103S 0.01252610 0.011470282 0.007299270 0.012486993 0.010405827 0.008324662
#> No1007S 0.01670146 0.015641293 0.011470282 0.016649324 0.014568158 0.002081165
#> No1114S 0.01531729 0.016429354 0.015334064 0.020765027 0.020765027 0.020765027
#> No1202S 0.01670146 0.011470282 0.007299270 0.008324662 0.010405827 0.014568158
#> No1206S 0.01670146 0.012513034 0.008342023 0.011446410 0.009365245 0.015608741
#> No1208S 0.01882845 0.017782427 0.013598326 0.018789144 0.016701461 0.002087683
#> No0910S No0912S No0913S No1103S No1007S No1114S
#> No305 0.017745303 0.014613779 0.018789144 0.012526096 0.016701461 0.01531729
#> No304 0.012513034 0.013555787 0.005213764 0.011470282 0.015641293 0.01642935
#> No306 0.008342023 0.009384776 0.005213764 0.007299270 0.011470282 0.01533406
#> No0906S 0.009365245 0.014568158 0.012486993 0.012486993 0.016649324 0.02076503
#> No0908S 0.011446410 0.012486993 0.012486993 0.010405827 0.014568158 0.02076503
#> No0909S 0.015608741 0.010405827 0.016649324 0.008324662 0.002081165 0.02076503
#> No0910S 0.000000000 0.013527575 0.009365245 0.011446410 0.015608741 0.01967213
#> No0912S 0.013527575 0.000000000 0.014568158 0.004162331 0.010405827 0.01857923
#> No0913S 0.009365245 0.014568158 0.000000000 0.012486993 0.016649324 0.01857923
#> No1103S 0.011446410 0.004162331 0.012486993 0.000000000 0.008324662 0.01530055
#> No1007S 0.015608741 0.010405827 0.016649324 0.008324662 0.000000000 0.01857923
#> No1114S 0.019672131 0.018579235 0.018579235 0.015300546 0.018579235 0.00000000
#> No1202S 0.003121748 0.012486993 0.008324662 0.010405827 0.012486993 0.01748634
#> No1206S 0.010405827 0.013527575 0.013527575 0.011446410 0.015608741 0.02185792
#> No1208S 0.017745303 0.012526096 0.018789144 0.010438413 0.002087683 0.02076503
#> No1202S No1206S No1208S
#> No305 0.016701461 0.016701461 0.018828452
#> No304 0.011470282 0.012513034 0.017782427
#> No306 0.007299270 0.008342023 0.013598326
#> No0906S 0.008324662 0.011446410 0.018789144
#> No0908S 0.010405827 0.009365245 0.016701461
#> No0909S 0.014568158 0.015608741 0.002087683
#> No0910S 0.003121748 0.010405827 0.017745303
#> No0912S 0.012486993 0.013527575 0.012526096
#> No0913S 0.008324662 0.013527575 0.018789144
#> No1103S 0.010405827 0.011446410 0.010438413
#> No1007S 0.012486993 0.015608741 0.002087683
#> No1114S 0.017486339 0.021857923 0.020765027
#> No1202S 0.000000000 0.009365245 0.014613779
#> No1206S 0.009365245 0.000000000 0.017745303
#> No1208S 0.014613779 0.017745303 0.000000000
#>
#> $sitesUsed
#> No305 No304 No306 No0906S No0908S No0909S No0910S No0912S No0913S
#> No305 962 959 960 958 958 958 958 958 958
#> No304 959 962 960 959 959 959 959 959 959
#> No306 960 960 963 959 959 959 959 959 959
#> No0906S 958 959 959 961 961 961 961 961 961
#> No0908S 958 959 959 961 961 961 961 961 961
#> No0909S 958 959 959 961 961 961 961 961 961
#> No0910S 958 959 959 961 961 961 961 961 961
#> No0912S 958 959 959 961 961 961 961 961 961
#> No0913S 958 959 959 961 961 961 961 961 961
#> No1103S 958 959 959 961 961 961 961 961 961
#> No1007S 958 959 959 961 961 961 961 961 961
#> No1114S 914 913 913 915 915 915 915 915 915
#> No1202S 958 959 959 961 961 961 961 961 961
#> No1206S 958 959 959 961 961 961 961 961 961
#> No1208S 956 956 956 958 958 958 958 958 958
#> No1103S No1007S No1114S No1202S No1206S No1208S
#> No305 958 958 914 958 958 956
#> No304 959 959 913 959 959 956
#> No306 959 959 913 959 959 956
#> No0906S 961 961 915 961 961 958
#> No0908S 961 961 915 961 961 958
#> No0909S 961 961 915 961 961 958
#> No0910S 961 961 915 961 961 958
#> No0912S 961 961 915 961 961 958
#> No0913S 961 961 915 961 961 958
#> No1103S 961 961 915 961 961 958
#> No1007S 961 961 915 961 961 958
#> No1114S 915 915 915 915 915 915
#> No1202S 961 961 915 961 961 958
#> No1206S 961 961 915 961 961 958
#> No1208S 958 958 915 958 958 958
#>
#> $regionUsed
#> IRanges object with 1 range and 0 metadata columns:
#> start end width
#> <integer> <integer> <integer>
#> [1] 1 965 965
#>
#dnastring2dist(hiv, model = "IUPAC", threads = 2)
hiv |> dnastring2dist(model = "IUPAC", threads = 2)
#>
Computing: [========================================] 100% (done)
#> $distSTRING
#> U68496 U68497 U68498 U68499 U68500 U68501
#> U68496 0.00000000 0.03296703 0.07326007 0.07692308 0.10256410 0.09523810
#> U68497 0.03296703 0.00000000 0.08791209 0.08424908 0.10989011 0.10989011
#> U68498 0.07326007 0.08791209 0.00000000 0.05128205 0.06959707 0.07326007
#> U68499 0.07692308 0.08424908 0.05128205 0.00000000 0.04029304 0.09523810
#> U68500 0.10256410 0.10989011 0.06959707 0.04029304 0.00000000 0.11355311
#> U68501 0.09523810 0.10989011 0.07326007 0.09523810 0.11355311 0.00000000
#> U68502 0.13553114 0.14285714 0.10256410 0.10622711 0.13186813 0.10622711
#> U68503 0.11721612 0.11721612 0.09890110 0.10622711 0.11721612 0.11355311
#> U68504 0.10989011 0.12454212 0.09157509 0.09157509 0.11355311 0.09890110
#> U68505 0.10989011 0.11721612 0.08424908 0.08791209 0.10989011 0.09890110
#> U68506 0.10622711 0.12454212 0.10256410 0.10256410 0.12087912 0.10256410
#> U68507 0.12454212 0.13919414 0.08424908 0.09523810 0.11355311 0.10622711
#> U68508 0.15018315 0.15018315 0.12454212 0.11355311 0.11355311 0.12454212
#> U68502 U68503 U68504 U68505 U68506 U68507
#> U68496 0.1355311 0.1172161 0.10989011 0.10989011 0.10622711 0.12454212
#> U68497 0.1428571 0.1172161 0.12454212 0.11721612 0.12454212 0.13919414
#> U68498 0.1025641 0.0989011 0.09157509 0.08424908 0.10256410 0.08424908
#> U68499 0.1062271 0.1062271 0.09157509 0.08791209 0.10256410 0.09523810
#> U68500 0.1318681 0.1172161 0.11355311 0.10989011 0.12087912 0.11355311
#> U68501 0.1062271 0.1135531 0.09890110 0.09890110 0.10256410 0.10622711
#> U68502 0.0000000 0.1208791 0.10622711 0.09890110 0.12087912 0.10622711
#> U68503 0.1208791 0.0000000 0.10989011 0.10256410 0.12087912 0.10256410
#> U68504 0.1062271 0.1098901 0.00000000 0.02930403 0.02930403 0.05494505
#> U68505 0.0989011 0.1025641 0.02930403 0.00000000 0.05128205 0.04029304
#> U68506 0.1208791 0.1208791 0.02930403 0.05128205 0.00000000 0.05494505
#> U68507 0.1062271 0.1025641 0.05494505 0.04029304 0.05494505 0.00000000
#> U68508 0.1282051 0.1172161 0.10256410 0.09157509 0.11355311 0.09157509
#> U68508
#> U68496 0.15018315
#> U68497 0.15018315
#> U68498 0.12454212
#> U68499 0.11355311
#> U68500 0.11355311
#> U68501 0.12454212
#> U68502 0.12820513
#> U68503 0.11721612
#> U68504 0.10256410
#> U68505 0.09157509
#> U68506 0.11355311
#> U68507 0.09157509
#> U68508 0.00000000
#>
#> $sitesUsed
#> U68496 U68497 U68498 U68499 U68500 U68501 U68502 U68503 U68504 U68505
#> U68496 273 273 273 273 273 273 273 273 273 273
#> U68497 273 273 273 273 273 273 273 273 273 273
#> U68498 273 273 273 273 273 273 273 273 273 273
#> U68499 273 273 273 273 273 273 273 273 273 273
#> U68500 273 273 273 273 273 273 273 273 273 273
#> U68501 273 273 273 273 273 273 273 273 273 273
#> U68502 273 273 273 273 273 273 273 273 273 273
#> U68503 273 273 273 273 273 273 273 273 273 273
#> U68504 273 273 273 273 273 273 273 273 273 273
#> U68505 273 273 273 273 273 273 273 273 273 273
#> U68506 273 273 273 273 273 273 273 273 273 273
#> U68507 273 273 273 273 273 273 273 273 273 273
#> U68508 273 273 273 273 273 273 273 273 273 273
#> U68506 U68507 U68508
#> U68496 273 273 273
#> U68497 273 273 273
#> U68498 273 273 273
#> U68499 273 273 273
#> U68500 273 273 273
#> U68501 273 273 273
#> U68502 273 273 273
#> U68503 273 273 273
#> U68504 273 273 273
#> U68505 273 273 273
#> U68506 273 273 273
#> U68507 273 273 273
#> U68508 273 273 273
#>
#> $regionUsed
#> IRanges object with 1 range and 0 metadata columns:
#> start end width
#> <integer> <integer> <integer>
#> [1] 1 273 273
#>
## create mask
mask1 <- IRanges::IRanges(start=c(1,61,121), end=c(30,90,150))
## use mask
hiv |> dnastring2dist(model="IUPAC", mask=mask1)
#>
Computing: [========================================] 100% (done)
#> $distSTRING
#> U68496 U68497 U68498 U68499 U68500 U68501
#> U68496 0.00000000 0.04371585 0.07650273 0.07103825 0.09836066 0.09836066
#> U68497 0.04371585 0.00000000 0.09289617 0.08743169 0.11475410 0.11475410
#> U68498 0.07650273 0.09289617 0.00000000 0.06010929 0.07650273 0.06557377
#> U68499 0.07103825 0.08743169 0.06010929 0.00000000 0.03825137 0.08743169
#> U68500 0.09836066 0.11475410 0.07650273 0.03825137 0.00000000 0.10382514
#> U68501 0.09836066 0.11475410 0.06557377 0.08743169 0.10382514 0.00000000
#> U68502 0.13661202 0.14207650 0.10382514 0.11475410 0.13114754 0.10382514
#> U68503 0.10928962 0.11475410 0.07650273 0.09289617 0.11475410 0.10382514
#> U68504 0.10382514 0.13114754 0.07650273 0.07650273 0.09836066 0.09836066
#> U68505 0.10928962 0.12568306 0.08196721 0.08196721 0.10382514 0.10382514
#> U68506 0.10928962 0.14207650 0.10382514 0.10382514 0.12021858 0.11475410
#> U68507 0.12021858 0.13661202 0.08196721 0.08196721 0.10382514 0.10382514
#> U68508 0.13661202 0.14207650 0.10382514 0.09289617 0.08743169 0.11475410
#> U68502 U68503 U68504 U68505 U68506 U68507
#> U68496 0.13661202 0.10928962 0.10382514 0.10928962 0.10928962 0.12021858
#> U68497 0.14207650 0.11475410 0.13114754 0.12568306 0.14207650 0.13661202
#> U68498 0.10382514 0.07650273 0.07650273 0.08196721 0.10382514 0.08196721
#> U68499 0.11475410 0.09289617 0.07650273 0.08196721 0.10382514 0.08196721
#> U68500 0.13114754 0.11475410 0.09836066 0.10382514 0.12021858 0.10382514
#> U68501 0.10382514 0.10382514 0.09836066 0.10382514 0.11475410 0.10382514
#> U68502 0.00000000 0.11475410 0.10382514 0.09836066 0.13114754 0.10928962
#> U68503 0.11475410 0.00000000 0.09289617 0.09289617 0.12021858 0.09289617
#> U68504 0.10382514 0.09289617 0.00000000 0.02732240 0.03278689 0.03278689
#> U68505 0.09836066 0.09289617 0.02732240 0.00000000 0.06010929 0.02732240
#> U68506 0.13114754 0.12021858 0.03278689 0.06010929 0.00000000 0.04371585
#> U68507 0.10928962 0.09289617 0.03278689 0.02732240 0.04371585 0.00000000
#> U68508 0.12568306 0.11475410 0.08196721 0.07650273 0.10928962 0.07650273
#> U68508
#> U68496 0.13661202
#> U68497 0.14207650
#> U68498 0.10382514
#> U68499 0.09289617
#> U68500 0.08743169
#> U68501 0.11475410
#> U68502 0.12568306
#> U68503 0.11475410
#> U68504 0.08196721
#> U68505 0.07650273
#> U68506 0.10928962
#> U68507 0.07650273
#> U68508 0.00000000
#>
#> $sitesUsed
#> U68496 U68497 U68498 U68499 U68500 U68501 U68502 U68503 U68504 U68505
#> U68496 183 183 183 183 183 183 183 183 183 183
#> U68497 183 183 183 183 183 183 183 183 183 183
#> U68498 183 183 183 183 183 183 183 183 183 183
#> U68499 183 183 183 183 183 183 183 183 183 183
#> U68500 183 183 183 183 183 183 183 183 183 183
#> U68501 183 183 183 183 183 183 183 183 183 183
#> U68502 183 183 183 183 183 183 183 183 183 183
#> U68503 183 183 183 183 183 183 183 183 183 183
#> U68504 183 183 183 183 183 183 183 183 183 183
#> U68505 183 183 183 183 183 183 183 183 183 183
#> U68506 183 183 183 183 183 183 183 183 183 183
#> U68507 183 183 183 183 183 183 183 183 183 183
#> U68508 183 183 183 183 183 183 183 183 183 183
#> U68506 U68507 U68508
#> U68496 183 183 183
#> U68497 183 183 183
#> U68498 183 183 183
#> U68499 183 183 183
#> U68500 183 183 183
#> U68501 183 183 183
#> U68502 183 183 183
#> U68503 183 183 183
#> U68504 183 183 183
#> U68505 183 183 183
#> U68506 183 183 183
#> U68507 183 183 183
#> U68508 183 183 183
#>
#> $regionUsed
#> IRanges object with 3 ranges and 0 metadata columns:
#> start end width
#> <integer> <integer> <integer>
#> [1] 31 60 30
#> [2] 91 120 30
#> [3] 151 273 123
#>
## use region
region1 <- IRanges::IRanges(start=c(1,139), end=c(75,225))
hiv |> dnastring2dist(model="IUPAC", region=region1)
#>
Computing: [========================================] 100% (done)
#> $distSTRING
#> U68496 U68497 U68498 U68499 U68500 U68501
#> U68496 0.00000000 0.02469136 0.05555556 0.06172840 0.10493827 0.09876543
#> U68497 0.02469136 0.00000000 0.08024691 0.07407407 0.11728395 0.12345679
#> U68498 0.05555556 0.08024691 0.00000000 0.04320988 0.06790123 0.05555556
#> U68499 0.06172840 0.07407407 0.04320988 0.00000000 0.04938272 0.09876543
#> U68500 0.10493827 0.11728395 0.06790123 0.04938272 0.00000000 0.12345679
#> U68501 0.09876543 0.12345679 0.05555556 0.09876543 0.12345679 0.00000000
#> U68502 0.12345679 0.14814815 0.08024691 0.11111111 0.13580247 0.07407407
#> U68503 0.11111111 0.12345679 0.09259259 0.11111111 0.12962963 0.09876543
#> U68504 0.12962963 0.14197531 0.08641975 0.09259259 0.12345679 0.10493827
#> U68505 0.12345679 0.13580247 0.09259259 0.09876543 0.12962963 0.11111111
#> U68506 0.12962963 0.14197531 0.08641975 0.09259259 0.12345679 0.09259259
#> U68507 0.12345679 0.14814815 0.08024691 0.09876543 0.12962963 0.09876543
#> U68508 0.16049383 0.17283951 0.12962963 0.12962963 0.12962963 0.12962963
#> U68502 U68503 U68504 U68505 U68506 U68507
#> U68496 0.12345679 0.11111111 0.12962963 0.12345679 0.12962963 0.12345679
#> U68497 0.14814815 0.12345679 0.14197531 0.13580247 0.14197531 0.14814815
#> U68498 0.08024691 0.09259259 0.08641975 0.09259259 0.08641975 0.08024691
#> U68499 0.11111111 0.11111111 0.09259259 0.09876543 0.09259259 0.09876543
#> U68500 0.13580247 0.12962963 0.12345679 0.12962963 0.12345679 0.12962963
#> U68501 0.07407407 0.09876543 0.10493827 0.11111111 0.09259259 0.09876543
#> U68502 0.00000000 0.11111111 0.09259259 0.08641975 0.09259259 0.08641975
#> U68503 0.11111111 0.00000000 0.09259259 0.09259259 0.09259259 0.09259259
#> U68504 0.09259259 0.09259259 0.00000000 0.03086420 0.01234568 0.04320988
#> U68505 0.08641975 0.09259259 0.03086420 0.00000000 0.04320988 0.03703704
#> U68506 0.09259259 0.09259259 0.01234568 0.04320988 0.00000000 0.04320988
#> U68507 0.08641975 0.09259259 0.04320988 0.03703704 0.04320988 0.00000000
#> U68508 0.12345679 0.12962963 0.09876543 0.09259259 0.09876543 0.09259259
#> U68508
#> U68496 0.16049383
#> U68497 0.17283951
#> U68498 0.12962963
#> U68499 0.12962963
#> U68500 0.12962963
#> U68501 0.12962963
#> U68502 0.12345679
#> U68503 0.12962963
#> U68504 0.09876543
#> U68505 0.09259259
#> U68506 0.09876543
#> U68507 0.09259259
#> U68508 0.00000000
#>
#> $sitesUsed
#> U68496 U68497 U68498 U68499 U68500 U68501 U68502 U68503 U68504 U68505
#> U68496 162 162 162 162 162 162 162 162 162 162
#> U68497 162 162 162 162 162 162 162 162 162 162
#> U68498 162 162 162 162 162 162 162 162 162 162
#> U68499 162 162 162 162 162 162 162 162 162 162
#> U68500 162 162 162 162 162 162 162 162 162 162
#> U68501 162 162 162 162 162 162 162 162 162 162
#> U68502 162 162 162 162 162 162 162 162 162 162
#> U68503 162 162 162 162 162 162 162 162 162 162
#> U68504 162 162 162 162 162 162 162 162 162 162
#> U68505 162 162 162 162 162 162 162 162 162 162
#> U68506 162 162 162 162 162 162 162 162 162 162
#> U68507 162 162 162 162 162 162 162 162 162 162
#> U68508 162 162 162 162 162 162 162 162 162 162
#> U68506 U68507 U68508
#> U68496 162 162 162
#> U68497 162 162 162
#> U68498 162 162 162
#> U68499 162 162 162
#> U68500 162 162 162
#> U68501 162 162 162
#> U68502 162 162 162
#> U68503 162 162 162
#> U68504 162 162 162
#> U68505 162 162 162
#> U68506 162 162 162
#> U68507 162 162 162
#> U68508 162 162 162
#>
#> $regionUsed
#> IRanges object with 2 ranges and 0 metadata columns:
#> start end width
#> <integer> <integer> <integer>
#> [1] 1 75 75
#> [2] 139 225 87
#>
## use mask and region
hiv |> dnastring2dist(model="IUPAC", mask=mask1, region=region1)
#>
Computing: [========================================] 100% (done)
#> $distSTRING
#> U68496 U68497 U68498 U68499 U68500 U68501
#> U68496 0.00000000 0.02857143 0.06666667 0.06666667 0.11428571 0.09523810
#> U68497 0.02857143 0.00000000 0.09523810 0.09523810 0.14285714 0.12380952
#> U68498 0.06666667 0.09523810 0.00000000 0.05714286 0.07619048 0.04761905
#> U68499 0.06666667 0.09523810 0.05714286 0.00000000 0.05714286 0.10476190
#> U68500 0.11428571 0.14285714 0.07619048 0.05714286 0.00000000 0.12380952
#> U68501 0.09523810 0.12380952 0.04761905 0.10476190 0.12380952 0.00000000
#> U68502 0.12380952 0.15238095 0.07619048 0.11428571 0.13333333 0.06666667
#> U68503 0.09523810 0.12380952 0.06666667 0.10476190 0.13333333 0.09523810
#> U68504 0.11428571 0.14285714 0.06666667 0.08571429 0.11428571 0.09523810
#> U68505 0.11428571 0.14285714 0.08571429 0.10476190 0.13333333 0.11428571
#> U68506 0.12380952 0.15238095 0.07619048 0.09523810 0.12380952 0.08571429
#> U68507 0.12380952 0.15238095 0.07619048 0.09523810 0.12380952 0.10476190
#> U68508 0.14285714 0.17142857 0.09523810 0.10476190 0.08571429 0.12380952
#> U68502 U68503 U68504 U68505 U68506 U68507
#> U68496 0.12380952 0.09523810 0.11428571 0.11428571 0.12380952 0.12380952
#> U68497 0.15238095 0.12380952 0.14285714 0.14285714 0.15238095 0.15238095
#> U68498 0.07619048 0.06666667 0.06666667 0.08571429 0.07619048 0.07619048
#> U68499 0.11428571 0.10476190 0.08571429 0.10476190 0.09523810 0.09523810
#> U68500 0.13333333 0.13333333 0.11428571 0.13333333 0.12380952 0.12380952
#> U68501 0.06666667 0.09523810 0.09523810 0.11428571 0.08571429 0.10476190
#> U68502 0.00000000 0.10476190 0.08571429 0.08571429 0.09523810 0.09523810
#> U68503 0.10476190 0.00000000 0.07619048 0.08571429 0.08571429 0.07619048
#> U68504 0.08571429 0.07619048 0.00000000 0.03809524 0.00952381 0.02857143
#> U68505 0.08571429 0.08571429 0.03809524 0.00000000 0.04761905 0.02857143
#> U68506 0.09523810 0.08571429 0.00952381 0.04761905 0.00000000 0.03809524
#> U68507 0.09523810 0.07619048 0.02857143 0.02857143 0.03809524 0.00000000
#> U68508 0.11428571 0.12380952 0.07619048 0.07619048 0.08571429 0.06666667
#> U68508
#> U68496 0.14285714
#> U68497 0.17142857
#> U68498 0.09523810
#> U68499 0.10476190
#> U68500 0.08571429
#> U68501 0.12380952
#> U68502 0.11428571
#> U68503 0.12380952
#> U68504 0.07619048
#> U68505 0.07619048
#> U68506 0.08571429
#> U68507 0.06666667
#> U68508 0.00000000
#>
#> $sitesUsed
#> U68496 U68497 U68498 U68499 U68500 U68501 U68502 U68503 U68504 U68505
#> U68496 105 105 105 105 105 105 105 105 105 105
#> U68497 105 105 105 105 105 105 105 105 105 105
#> U68498 105 105 105 105 105 105 105 105 105 105
#> U68499 105 105 105 105 105 105 105 105 105 105
#> U68500 105 105 105 105 105 105 105 105 105 105
#> U68501 105 105 105 105 105 105 105 105 105 105
#> U68502 105 105 105 105 105 105 105 105 105 105
#> U68503 105 105 105 105 105 105 105 105 105 105
#> U68504 105 105 105 105 105 105 105 105 105 105
#> U68505 105 105 105 105 105 105 105 105 105 105
#> U68506 105 105 105 105 105 105 105 105 105 105
#> U68507 105 105 105 105 105 105 105 105 105 105
#> U68508 105 105 105 105 105 105 105 105 105 105
#> U68506 U68507 U68508
#> U68496 105 105 105
#> U68497 105 105 105
#> U68498 105 105 105
#> U68499 105 105 105
#> U68500 105 105 105
#> U68501 105 105 105
#> U68502 105 105 105
#> U68503 105 105 105
#> U68504 105 105 105
#> U68505 105 105 105
#> U68506 105 105 105
#> U68507 105 105 105
#> U68508 105 105 105
#>
#> $regionUsed
#> IRanges object with 2 ranges and 0 metadata columns:
#> start end width
#> <integer> <integer> <integer>
#> [1] 31 60 30
#> [2] 151 225 75
#>
## use asymmetric score matrix
myscore <- iupacMatrix()
myscore[1, 4] <- 0.5
(hiv |> dnastring2dist(score=myscore, symmetric=FALSE))$distSTRING[1:2, 1:2]
#>
Computing: [========================================] 100% (done)
#> U68496 U68497
#> U68496 0.00000000 0.03296703
#> U68497 0.03113553 0.00000000